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传统 的 计算 机 课程 体系 人 为 地 割裂 了 解决 问题 时 所 需 技 能 的 综合 性 。 例 如 汇编 语言 、 计 算 机 原 
理 、 计 算 机 系统 结构 、 PAE REAN EA LAES AE EA EEE ee 但 定 随 
着 多 核 系统 日 渐 成 为 主流 ， 这 种 软 硬 件 分 离 的 教学 方法 变 得 不 切实 际 。 


国内 外 大 学 都 在 这 方面 展开 了 探索 ， 即 如 何 用 一 种 综合 的 方法 来 介绍 计算 机 系统 的 相关 内 容 。 卡 
AZ EAS 的 《深入 理解 计算 机 系统 》 是 目前 比较 成 功 的 探索 ， 它 主要 从 程序 员 视角 来 讲解 计 
算 机 系统 ， 内 容 偏向 系统 软件 ( 特别 是 操作 系统 ) ， 国 内 外 很 多 大 学 已 采用 该 教材 作为 课程 的 基础 。 
而 佐治 亚 理工 学 院 的 这 本 教材 则 是 另 一 个 有 益 的 莹 试 ， 书 中 计算 机 系统 结构 和 操作 系统 的 内 容 基本 平 
衡 ， 旨 在 让 学 生 了 解 计 算 机 体系 结构 和 系统 软件 之 间 的 和 关系， 为 进一步 深入 学 习 计算 机 体系 结构 、 操 
作 系 统 和 网 络 的 高 级 课程 或 研究 生 课 程 ， 在 这 些 领域 进一步 深造 葛 定 恨 好 的 基础 。 


本 书 采用 软 硬 件 集成 的 方法 ， 系 统 地 讲解 了 计算 机 系统 的 软件 和 硬件 知识 及 其 相互 天 系 。 全 书 分 
为 5 个 模块 : 处 理 器 、 内 存 系统 、 存 储 系统 、 并 行 系统 和 网 络 ， 分 别 讨论 了 处 理 器 及 其 相关 的 软件 问 
题 、 内 存 系 统 和 分 级 存储 体系 、I/O 和 文件 系统 、 操 作 系统 问题 及 支持 并 行 编程 的 多 处 理 器 中 相应 体 
系 结构 的 特点 、 网 络 硬件 的 发 展 和 人 处理 各 种 网 络 行为 的 网 络 协议 栈 的 特点 等 。 
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文 乞 复兴 以 来 源远流长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 替 出 、 独 领 风骚 。 在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 - 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 狐 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 办 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ,美国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 证 和 发 展 的 经 典 教材 仍 有 许多 值得 侍 鉴 之 处 。 因此， 引进 一 批 国 外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 " 。 自 1998 年 开始 ,我们 
就 将 工作 重点 放 在 了 入 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 展 
好 的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brain W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. 
Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 谈 者 演习、 研究 
及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提 供 了 中 
肯 的 选 题 指 导 ， 还 不 辞 劳 昔 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 - 迄今 ,“ 计 算 机 科 尝 丛书 ”已 经 出 版 了 近 两 百 
个 品种 ， 这 些 书 籍 在 读者 中 树立 了 恨 好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原 版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 和 又 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 深 
化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 入 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢 迎 老 师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 


电子 邮件 ， hzjsj@hzbook.com 
联系 电话 : (010) 88379604 
联系 地 址 ， 北 京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 
邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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美国 未 来 学 家 阿尔 温 * 托 夫 勒 在 1980 年 3 月 出 版 了 他 的 经 典 著 作 《 第 三 次 浪潮 》 该 书 
在 全 世界 引起 了 巨大 的 反响 。 在 这 本 书 中 ， 他 将 人 类 社会 发 展 分 为 农业 阶段 、 工 业 阶 段 和 以 
言 息 时 代为 主要 特征 的 后 工业 化 社会 阶段 。 从 历史 视角 来 看 ， 信 息 化 具有 与 工业 革命 等 同 的 
重要 性 ， 将 重 塑 我 们 的 社会 结构 和 日 常生 活 。 

计算 机 是 信息 化 的 核心 ， 随 着 信息 化 与 社会 生活 的 深度 融合 ， 人 们 对 计算 机 专业 毕业 生 
的 要 求 也 越 来 越 高 。 他 们 不 仅 需 要 掌握 计算 机 本 身 的 知识 ， 还 需要 了 解 相 关 行 业 的 知识 。 这 
就 给 计算 机 专业 教学 带 来 了 很 大 的 挑战 ， 如 何在 有 限 的 课时 里 面 ， 能 够 覆盖 计算 机 专业 的 核 
心 内 容 ， 提 供给 学 生 足 够 的 基础 使 其 能 够 在 所 选 的 方向 上 继续 深造 呢 ? 

传统 的 计算 机 课程 体系 有 一 个 重要 问题 ， 就 是 课程 人 为 地 割裂 了 解决 问题 时 所 需 技能 的 
综合 性 。 例 如 汇编 语言 、 计 算 机 原理 、 计 算 机 系统 结构 、 操 作 系统 和 编译 原理 分 别 从 不 同 角 
度 介 绍 了 计算 机 的 硬件 和 软件 系统 ， 但 人 们 在 面临 一 个 具体 问题 的 时 候 ， 比 如 优化 一 个 数据 
分 析 程 序 时 需要 的 技能 是 综合 性 的 ， 需 要 知道 高 级 语言 程序 变 成 了 什么 样 的 汇编 语言 ， 这 些 
汇编 语言 在 操作 系统 的 调度 下 如 何 加载 和 和 运行， 运行 时 的 指令 如 何在 处 理 器 的 流水 线 里 乱 序 
执行 ， 其 访 存 是 缓存 命中 还 是 缓存 缺失 ， 并 发 访问 是 如 何 相 互 隔离 的 ， 等 等 。 

因此 ， 国 内 外 大 学 都 在 这 方面 展开 了 探索 ， 即 如 何 用 一 种 综合 的 方法 来 介绍 计算 机 系统 
的 相关 内 容 ， 这 样 不 但 可 以 减少 课时 ， 也 能 让 相关 知识 的 衔接 更 加 平滑 ， 整 体 的 知识 体系 更 
加 系统 化 。CMU 的 《深入 理解 计算 机 系统 》 是 目前 比较 成 功 的 探索 ， 国 内 外 很 多 大 学 都 已 采 
用 该 教材 作为 课程 的 基础 。 我 们 翻译 的 这 本 书 则 是 另 一 个 有 益 的 尝试 。 本 书 中 计算 机 系统 结 
构 和 操作 系统 的 内 容 基 本 平衡 ， 而 《深入 理解 计算 机 系统 》 则 明显 偏向 操作 系统 ， 对 计算 机 
系统 结构 的 相关 内 容 介绍 相对 较 少 。 例 如 ， 本 书 对 IO 中 断 处 理 专门 安排 了 硬件 实验 ， 要 求 
学 生 用 硬件 设计 语言 设计 CPU 并 支持 中 断 处 理 ， 这 类 实验 对 学 生理 解 整个 计算 机 系统 是 如 何 
运作 的 非常 重要 ， 但 在 《深入 理解 计算 机 系统 》 中 没有 这 部 分 内 容 。 

我 们 希望 本 书 的 翻译 出 版 ， 能 够 为 国内 的 计算 机 系统 教育 提供 一 种 新 的 选择 。 对 希望 未 
来 研究 、 设 计 新 型 计算 机 系统 的 学 生来 说 ， 本 书 提供 了 更 加 完整 的 基础 。 

本 书 的 翻译 是 由 我 和 我 的 学 生 完 成 的 ， 我 本 人 翻译 了 前 言 和 第 1 章 ， 汤 雄 超 翻 译 了 
第 2 ~ 4 音 , 杨 飞 翻 译 了 第 5 ~ 7 章 ， 张 峰 翻 译 了 第 8 ~ 10 章 ， 朱 了 晓 伟 翻译 了 第 11 ~ 12 章 ， 
陈 力 维 翻译 了 第 13 章 和 附录 。 本 人 对 全 书 进行 了 审 校 ， 因 此 书 中 的 错误 都 应 该 由 本 人 负责 。 

感谢 机 械 工业 出 版 社 华章 公司 将 这 本 书 引入 国内 ， 感 谢 温 莉 芳 副 总 经 理 、 朱 动 编辑 和 关 
敏 编辑 在 本 书 翻译 过 程 中 给 予 我 们 的 极 大 耐心 。 
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为 什么 在 计算 机 系统 领域 需要 有 一 本 新 书 


和 高 中 生 谈 论 计算 机 会 让 人 感到 兴奋 。 人 们 对 “盒子 (计算 机 机 箱 ) 里 ”有 什么 东西 有 
一 种 神秘 感 ， 正 是 那个 盒子 里 的 东西 使 计算 机 能 够 完成 诸如 让 用 户 玩 有 很 棒 图 形 的 视频 游戏 、 
播放 首 乐 (不 管 是 RAP 还 是 交 啊 乐 )、 发 送 即 时 消息 给 用 户 的 朋友 等 功能 。 本 书 的 目的 就 是 与 
读者 一 起 开展 一 段 揭 示 盒 子 里 有 什么 秘密 的 旅程 。 作 为 即将 开展 的 旅程 的 一 区 ， 让 我 们 在 一 
开始 就 表明 ， 让 这 个 盒子 变 得 有 趣 的 并 不 仅仅 是 人 硬件， 还 包括 软件 和 硬件 是 如 何 结合 起 来 完 
成 各 种 功能 的 。 因 此 ， 本 书 所 采用 的 途径 是 把 软件 和 硬件 放 在 一 起 观察 ， 看 它们 是 如 何 相互 
帮助 以 及 如 何 协同 起 来 让 计算 机 变 得 有 趣 而 且 有 用 的 。 我 们 把 这 个 过 程 称 作 “打开 盒子 "一 一 
即 的 开 盒 于 里 有 什么 这 个 秘密 : 我 们 查看 盒子 内 部 并 理解 如 何 设计 关键 的 便 件 单元 CA a 
内 存 以 及 外 设 控制 项 )， 理 解 要 管理 计算 机 中 的 所 有 硬件 资源 ， 包 括 处 理 器 、 内 存 、LILO 和 硬 
盘 、 多 处 理 需 以 及 网 络 所 需 的 操作 系统 抽象 。 因 此 ， 这 是 一 本 计算 机 系统 教学 的 入门 课程 教 
材 ， 采 用 了 一 种 新 视 的 集成 教学 法 来 介绍 相关 内 容 。 

本 书 的 目标 是 让 学 生 在 本 科 生 涯 (计算 机 科学 或 计算 机 工程 专业 ) 的 早期 就 在 相关 主题 方 
面 接触 足 够 客 泛 的 知识 。 本 书 的 内 容 是 为 用 软 便 件 集 成 的 方式 进行 课程 教学 而 写 的 ， 这 种 方 
式 使 得 学 生 可 以 了 解 计算 机 体系 结构 和 系统 软件 之 间 的 关系 。 书 中 的 材料 可 以 作为 4 学 分 的 
半年 学 期 课程 教材 ， 或 者 作为 5 学 分 的 季度 课程 教材 ， 或 是 作为 每 季度 3 学 分 的 两 季度 的 这 
程 系 列 的 教材 。 基 于 本 书 的 课程 可 以 为 学 生 打 下 很 好 的 基础 ， 以 进一步 深入 学 习 计 算 机 体系 
结构 、 操 作 系 统 和 网 络 的 高 级 课程 或 研究 生 课程 ， 在 这 些 领域 进一步 深造 。 此 外 ， 这 类 诛 程 
可 以 尽早 激发 学 生 对 计算 机 系统 的 兴趣 ， 对 学 生 在 本 科 期 间 参 加 人 研究 工作 也 有 帮助 。 

本 书 的 主要 特点 (除了 人 处理 带 和 内 存 系统 之 外 ) 如 下 : 

1 ) 详细 介绍 了 存储 系统 ; 

2) 专门 用 一 章 介 绍 了 网 络 问题 ; 

3) 专门 用 一 章 介绍 了 多 线程 和 多 进程 编程 。 


教学 风格 


本 书 采 用 的 教学 风格 是 “发 现 ” 而 非 “ 教 导 ” 或 “灌输 ” 。 此 外 ， 内 容 是 以 “ 目 顶 癌 下 - 
的 方式 展现 的 ， 读 者 首先 看 到 我 们 要 解决 的 问题 ， 然 后 看 到 解决 方案 。 以 内 存 管理 部 分 (第 8 
章 ) 为 例 。 我 们 首先 提出 问题 “什么 是 内 存 管理 ”， 一 旦 理解 了 内 存 管理 的 需求 ， 我 们 再 开始 
探讨 内 存 管 理 所 需 的 软件 技术 和 相应 的 硬件 支持 。 因 此 ， 本 书 是 以 一 种 讲 故事 的 方式 来 进行 
概念 展现 ， 学 生 们 看 起 来 很 喜欢 这 种 方式 。 在 适当 的 地 方 ， 我 们 在 不 同 章节 用 一 些 例 题 来 并 
明 观 点 。 

我 们 在 撰写 本 书 的 时 候 始 终 以 学 生 为 中 心 。 书 中 包含 大 量 例 题 ， 可 以 帮助 学 生 固 化 刚刚 
讨论 过 的 概念 。 从 我 们 作为 教师 的 经 验 来 看 ， 学 生 确实 喜欢 了 解 历 史 背 景 (那些 对 计算 的 演 
化 起 到 重要 影响 的 著名 的 计算 机 科学 家 和 机 构 ) 和 现状 ， 以 及 我 们 是 怎么 一 步 一 步 发 展 过 来 
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的 。 这 些 历史 片段 届 布 在 全 书 中 。 除 此 之 外 ， 在 必要 的 时 候 ， 在 若干 章 我 们 都 包括 了 一 节 从 
历史 角度 进行 的 回顾 。 我 们 从 学 生 那 里 学 到 并 采用 的 另 一 个 措施 是 在 文中 直接 给 出 参考 文献 ， 
而 不 是 在 文 末 才 给 出 。 读者 可 以 看 到 贯穿 本 书 的 大 量 脚注 。 此 外 ,我 们 在 每 章 未 尾 专门 有 一 
方 给 出 外 部 链接 (教材 和 开创 性 的 著作 )， 包 括 参 考 文献 和 扩展 阅读 的 建议 ， 这 些 内 容 在 正文 
中 不 一 定 都 被 引用 了 ， 但 是 有 助 于 增强 学 生 的 知识 基础 。 今天 ， 随 着 因特网 上 的 信息 日 益 丰 
名， 为 附加 的 信息 提供 URL 链接 是 一 件 很 有 诱惑 力 的 事情 。 但 是 ,我 们 拒绝 了 这 一 诱惑 ( 除 
了 那些 权威 信息 源 的 可 靠 链接 )。 尽 管 如 此 ， 我们 知道 现在 学 生 在 去 图 书馆 之 前 会 先 搜索 因 特 
网 ， 当 然 他 们 也 应 该 这 么 做 。 在 这 种 情况 下 ， 我们 给 学 生 一 个 提示 : 在 利用 因特网 作为 信息 
源 的 时 候 要 慎重 。 通 常 ， 使 用 Google 搜索 是 获取 某 种 信息 的 最 快 方法 。 但 是 ， 必 须 对 这 些 信 
县 进行 入 选 以 保证 其 准确 性 。 作 为 经 验 法 则 ， 使 用 因特网 上 的 信息 来 满足 好 奇 心 或 是 回答 与 
流言 有 关 的 问题 。(DEC 是 如 何 衰落 的 ?” 为 什么 Linux 成 功 了 而 Unix BSD 却 没有 ? Burroughs 
公司 的 历史 是 什么 ?计算 机 系统 的 真正 先驱 是 哪些 人 ? ) 对 于 技术 问题 (Pentium 4 处 理 器 的 
流水 线 结构 是 什么 ? VAX 11/780 的 指令 集体 系 结构 是 什么 ? ) 则 要 从 已 出 版 的 书籍 、 相 关 会 
议和 期 刊 论文 (当然 它们 中 的 大 多 数 也 可 以 在 线 获取 ) 中 寻求 答案 。 

佐治 亚 理 工学 院 计 算 机 学 院 从 1999 年 秋季 学 期 开始 ， 每 学 期 都 开设 这 门 软 硬 件 集成 的 课 
程 ， 本 教材 就 是 这 门 课 程 的 副产品 。 在 一 开始 ， 本 书 作者 为 课程 开发 了 完整 的 讲义 和 幻灯 片 ， 
并 使 用 两 本 标准 的 教材 (一 本 体系 结构 教材 和 一 本 操作 系统 教材 ) 作为 课程 的 背景 参考 资料 来 
IERE E MA 2005 年 春季 开始 ， 我 们 将 课件 转换 成 了 本 教材 的 手稿 ， 因 为 学 生 一 直 想 
要 一 本 与 课程 内 容 和 风格 匹配 的 教材 。 pe nag ge me a 
院 用 于 本 课程 ， 使 用 集成 的 方法 介绍 计算 机 系统 。 本 课程 每 年 开设 3 次 (包括 夏季 学 期 )， 
学 期 有 80 多 名 学 生 选 课 。 因 此 ,书稿 在 付 印 之 前 经 过 了 连续 15 个 学 期 的 教学 ， pirar 
的 学 生 那 里 接受 了 持续 不 断 的 反馈 与 改进 意见 。 

在 设计 产生 本 书 的 谏 程 时 ， 以 及 在 撰写 本 书 的 时 候 ， 我 们 从 其 他 机 构 开 设 的 系统 入 门 课 
程 以 及 一 些 优秀 教材 中 学 到 了 很 多 东西 。 例 如 ，MIT 2 的 计算 机 系统 入 门 课程 拥有 很 长 的 历 
史 和 传统 ， 而 且 是 真正 独一无二 的 。 从 这 门 课 程 中 总 结 的 教材 [Saltzer，2009] 对 激发 学 生 深 
入 学习 计算 机 系统 来 说 是 极 好 的 资源 。 在 撰写 本 书 的 时 候 ， 我 们 坦承 受到 了 [Ward，1989] 和 
[Kurose, 2006] 的 教学 法 的 启发 。 


本 书 的 结构 和 可 能 的 阅读 路 径 


本 书 的 知识 内 容 可 以 分 为 5 个 模块 。 下 面 的 路 线 图 建议 了 一 些 可 能 的 阅读 路 径 。 这 些 路 
径 假设 关于 体系 结构 和 操作 系统 的 内 容 一 样 多 。 

1) 处 理 器 ”本 书 的 第 一 个 模块 是 关于 处 理 器 以 及 与 处 理 器 相关 的 软件 问题 的 。 我 们 从 探 
索 如 何 设计 盒子 中 的 大 脑 8 (处 理 器 ) 开始 。 有 哪些 软件 问题 ”既然 计算 机 的 大 部 分 部 件 主要 
是 使 用 高 级 语言 编程 的 ， 我 们 考虑 了 高 级 语言 结构 是 如 何 影响 处 理 器 的 指令 集 的 (第 2 BE). 
一 旦 理解 了 指令 集 的 设计 ， 我 们 就 开始 关注 实现 处 理 的 硬件 技术 。 我 们 从 实现 一 个 人 简单 的 处 
理 器 开始 (第 3 章 )， 然 后 考虑 实现 一 个 使 用 流水 线 技术 的 性 能 优化 的 处 理 器 (第 5 章 )。 人 处 理 
胡 是 计算 机 系统 中 的 宝贵 资源 ， 因 此 必须 在 多 个 相互 欧 争 的 程序 间 复 用 ， 正 如 第 1 草 中 视频 
游戏 的 例子 所 揭示 的 一 样 ( 见 1.3 节 )。 操 作 系 统 的 职责 就 是 保证 资源 的 有 效 使 用 。 本 模块 以 


© http://mit.edu/6.033/www/ 
O 原 书 封面 中 的 解剖 图 用 来 表示 将 计算 类 比 为 在 人 体内 自然 发 生 的 网 络 分 布 式 处 理 . 
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H FALIE a De) E WHE RAAR (第 6 章 )。 

我 们 预计 第 2. 3. 5 和 6 章 每 章 需 要 3 小 时 的 课堂 讲授 时 间 和 1 小 时 的 练习 题 时 间 。 

2 ) 内 存 系统 ”第 二 个 模块 介绍 了 内 存 系统 和 内 存 层次 。 计 算 机 程序 包括 代码 和 数据 ， 并 
且 都 需要 存放 的 空间 。 计 算 机 的 内 存 系统 可 能 是 决定 性 能 最 为 关键 的 因素 。 如 果 内 存 系统 不 
能 以 死 配 处 理 融 速度 的 方式 提供 执行 程序 所 需 的 代码 和 数据 ， 处 理 器 速度 (现在 以 Ghz 为 量 
E) 就 毫 无 意义 。 由 于 技术 的 进步 ， 内 存 系统 的 大 小 一 直 在 跨越 式 发 展 ， 但 应 用 程序 使 用 内 
存 的 胃口 也 在 以 同样 的 速度 增长 着 ， 如 果 不 是 增长 得 更 快 的 话 。 因 此 ， 内 存 也 是 宝贵 资源 ， 
操作 系统 的 作用 就 是 保证 用 好 资源 。 本 模块 的 第 一 部 分 是 关于 有 效 管理 内 存 的 操作 系统 算法 
以 及 相应 的 体系 结构 支持 的 (第 7 章 和 第 8 章 ); 第 二 部 分 则 介绍 内 存 层 次 ， 可 以 帮助 降低 处 
理 需 在 访问 代码 和 数据 时 的 延迟 (第 9 章 )。 

我 们 预计 第 7、8 和 9 草 每 草 需 要 3 小 时 的 课 向 讲授 时 间 和 1 小 时 的 练习 题 时 间 。 

3) 存储 系统 ”第 三 个 模块 是 关于 VO (特别 是 稳定 存储 ) 和 文件 系统 的 。 只 有 与 计算 机 
进行 交互 才能 让 计算 机 有 用 且 有 趣 。 首 先 ， 我 们 讨论 能 够 把 处 理 需 的 注意 力 从 当前 执行 的 程 
序 中 脱离 出 来 的 硬件 机 制 (第 4 章 )。 这 些 机 制 既 包括 外 部 事件 也 包括 处 理 器 执行 程序 时 遇 到 
的 内 部 异常 。 与 硬件 机 制 相关 的 软件 问题 是 解决 正常 程序 执行 的 “不 连续 ”性 ， 包 括 记录 原 
有 程序 的 执行 位 置 以 及 程序 的 当前 执行 状态 。 然 后 ， 我 们 介绍 处 理 需 与 IO 设备 的 接口 机 制 
以 及 相应 的 底层 软件 技术 (第 10 章 )， 并 特别 强调 了 磁盘 子 系 统 。 随 后 ,我 们 完整 地 介绍 了 在 
稳定 的 存储 设备 (如 磁盘 ) 上 如 何 构 建文 件 系统 (第 11 BE). 

我 们 预计 第 4 章 和 第 10 章 每 章 需 要 3 小 时 的 课堂 讲授 时 间 和 1 小 时 的 练习 题 时 间 ,， 第 11 
章 需 要 6 小 时 的 课堂 讲授 时 间 和 2 小 时 的 练习 题 时 间 ， 

4 ) 并 行 系统 ”计算 机 体系 结构 是 一 个 快速 变化 的 领域 。 芯 片 密度 、 处 理 器 速度 、 内 存 容 
量 等 在 过 去 20 年 中 都 呈现 出 指数 增长 速度 ， 并 在 可 预见 的 未 来 仍然 保持 这 样 的 增长 速度 。 并 
行 处 理 已 不 再 是 超级 计算 机 独 有 的 深奥 概念 。 随 着 在 一 个 芯片 上 集成 多 个 CPU 的 多 核 技 术 的 
到 来 ， 并 行 性 已 经 变 得 很 和 常见。 因此， 理解 与 并 行 性 有 关 的 软件 和 硬件 技术 对 于 回答 “盒子 
里 有 什么 ”这 样 的 问题 十 分 必要 。 这 个 模块 包括 多 处 理 器 中 支持 并 行 编程 的 操作 系统 问题 以 
及 相应 的 体系 结构 功能 (第 12 草 )。 

我 们 预计 第 12 章 需 要 6 小 时 的 课堂 讲 授时 间 和 2 小 时 的 练习 题 时 间 。 

5) 网 络 ”在 我 们 生活 的 世界 上， 单独 一 个 盒子 几乎 没有 任何 用 处 ， 除 非 它 与 外 部 世界 相 
连 。 与 你 的 朋友 在 网 络 上 对 战 多 人 视频 游戏 (在 第 1 章 介绍 ) 是 一 个 很 好 的 例子 。 但 即使 在 日 
常生 活 中 ， 我们 也 需要 利用 网 络 来 收发 电子 邮件 或 浏览 因特网 等 。 网 络 与 其 他 输入 /输出 设 
备 的 不 同 之 处 在 于 ， 现 在 你 的 盒子 得 以 连接 世界 了 ! 你 需要 一 种 语言 让 你 的 盒子 与 外 部 世界 
交谈 ， 并 处 理 网 络 的 各 种 情况 ， 例 如 暂时 或 永久 的 连接 中 断 。 这 一 模块 讨论 了 网 络 硬件 的 进 
化 ， 以 及 用 来 处 理 各 种 网 络 状况 的 网 络 协 议 栈 (操作 系统 的 一 部 分 ) 的 功能 (第 13 章 )。 

我 们 预计 第 13 章 需 要 6 小 时 的 课堂 讲授 时 间 和 2 小 时 的 练习 题 时 间 。 

总 而 言 之 , 第 2 章 ~ 第 10 章 每 章 需 要 用 1 周 时 间 授 课 ; 第 11 章 ~ 第 13 章 每 章 需 要 2 周 
时 间 授 课 ， 正 好 在 15 周 的 一 个 学 期 里 讲 完 。 五 个 模块 中 的 软件 和 硬件 问题 在 本 书 中 是 一 起 介 
绍 的 ， 上 述 建议 的 阅读 路 径 也 是 按照 这 种 处 理 方 式 进行 的 。 

读者 也 可 以 选择 在 体系 结构 和 操作 系统 主题 之 间 重 点 关注 某 部 分 的 内 容 ， 而 不 会 损失 连 
续 性 。 以 处 理 器 模块 为 例 ， 第 3 章 和 第 5 章 都 是 关于 处 理 器 的 硬件 实现 问题 的 。 对 于 偶 重 操 
作 系 统 的 课程 ， 可 以 考虑 少 讲授 或 者 完全 跳 过 介绍 流水 线 处 理 器 实现 (从 5.7 节 开 始 ) 的 第 5 
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EM AN SST AUR PEAY ESE. 类 似 地 ， 在 偏重 体系 结构 的 课程 里 ， 可 以 跳 过 介绍 处 理 器 调 
度 算法 的 第 6 章 ， 而 不 会 损失 课程 的 连续 性 

在 内 存 模块 中 ， 第 8 章 从 操作 系统 角度 涉及 页 式 内 存 管理 的 细节 。 偏重 体 系 结 构 的 课程 
可 以 跳 过 这 一 章 ， 而 不 会 损失 连续 性 。 类 似 地 ， 偏 重 操作 系统 的 课程 可 以 选择 淡化 第 9 章 中 
对 绥 存 的 细节 描述 。 

在 存储 模块 中 ， 面 回 体 系 结构 的 课程 可 以 选择 淡化 第 11 章 中 文件 系统 的 内 容 ， 而 不 必 提 
心 损失 连续 性 . 

在 并 行 模块 中 (第 12 章 )， 面 向 体系 结构 的 课程 可 以 跳 过 多 线程 的 操作 系统 支持 ， 以 及 一 
些 高 级 主题 ， 包 括 多 处 理 需 调度 、 死 锁 以 及 并 发 性 的 经 典 问 题 和 解决 方案 ; 类 似 地 ， 面 向 操 
作 系 统 的 课程 可 以 选择 跳 过 体系 结构 方面 的 高 级 主题 ， 例 如 多 处 理 器 缓存 一 臻 性、 并 行 机 的 
分 类 以 及 互连网 络 等 。 考 虑 到 并 行 性 的 重要 性 ,在 任何 课程 中 ， 只 要 时 间 许 可 ， 应 尽量 覆盖 
这 一 章 的 全 部 内 容 . 

在 网 络 模块 中 (第 13 章 )， 面 向 体系 结构 的 课程 可 以 跳 过 传输 层 和 网 络 层 的 细节 (分别 是 
13.6 WAI 13.7 节 )。 面 向 操作 系统 的 课程 可 以 选择 少 讲 一 些 协议 栈 的 链 路 层 (13.8 节 ) 和 网 络 
硬件 ( 13.9 节 ) 的 内 容 。 


本 教材 在 计算 机 科学 课程 体系 中 的 位 置 


图 P-1 显示 了 了 计算 机 系统 的 抽象 层次 。 我 们 可 以 尝试 将 网 P-1 中 的 不 同 层 次 的 抽象 与 传 
统计 算 机 科学 课程 体系 中 的 课程 相关 联 。 诸 如 基础 程序 设计 、 面 向 对 象 程序 设计 、 图 形 学 以 
K HCI (人 机 交互 ) 的 课程 通常 使 用 较 高 层次 的 抽象 。 通 常 计算 机 科学 和 计算 机 工程 的 课程 体 
系 中 包含 数字 电路 和 逮 辑 电路 设计 的 基础 课程 ， 然 后 是 计算 机 组 成 原理 ， 介 绍 计算 机 的 硬件 
设计 。 在 计算 机 组 成 原理 课程 之 上 (在 图 P-1 的 抽象 层次 级 别 之 上 )， 大 部 分 课程 使 用 烟 欠 方 
法 : 不 同 的 课程 分 别 履 盖 计 算 机 体系 结构 、 操 作 系 统 和 计算 机 网 络 的 高 级 概念 。 


应 用 程序 (高 级 语言 表示 的 算法 ) 
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图 P-1 计算 机 系统 中 的 抽象 层次 


今天 ， 设 计 计 算 机 系统 已 经 是 软 硬 件 集 成 的 过 程 ， 这 使 人 们 对 烟 囚 模式 提出 了 质疑 ， 特 
别 是 对 计算 机 科学 本 科 的 课程 体系 中 学 生发 展 专业 技能 的 早期 。 

以 本 书 为 基础 围绕 上 述 主题 的 课程 是 一 种 独特 的 尝试 ， 用 集成 的 方法 在 计算 机 系统 的 入 
门 课程 中 介绍 中 间 层 次 的 概念 (覆盖 了 图 P-1, 中 的 深 色 区 域 一 一 系统 软件 及 其 与 计算 机 体系 结 
构 的 关系 )。 这 门 课程 将 为 渴望 学 习 计 算 机 体系 结构 、 操 作 系统 和 网 络 中 的 高 级 主题 (图 P-2 ) 
的 学 生 提 供 坚 实 的 基础 ， 
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图 P-2 系统 课程 系列 


使 用 本 书 内 容 的 课程 的 先 修 课 程 很 直接 : 逻辑 设计 基础 和 高 级 语言 程序 设计 (最 好 是 C 
语言 ) 基础 。 换 句 话 说 ， 对 在 本 书 内 容 之 上 和 之 下 的 抽象 层次 需要 有 基本 的 理解 ( 见 图 P-1 )。 

在 数字 电路 和 俱 辑 设计 基础 以 及 程序 设计 基础 方面 都 有 非常 优秀 的 教科 书 。 类 似 地 ， 在 
计算 机 体系 结构 、 操 作 系 统 和 计算 机 网 络 的 高 级 主题 方面 ,也 有 优秀 的 教科 书 。 唯 独 缺 少 的 
是 对 计算 机 系统 进行 简单 、 集 成 化 的 介绍 ， 使 其 成 为 基础 课程 和 高 级 主题 之 间 桥 梁 的 图 书 。 
本 书 的 目标 就 是 成 为 这 样 一 座 桥梁 。 

计算 机 科学 作为 一 门 学 科 其 边界 已 经 扩展 了 。 相 应 地 ， 学 习 计 算 机 科学 的 学 生 的 兴趣 也 
各 不 同 。 计 算 机 科学 的 课程 需要 为 学 生 在 本 科 阶 段 的 学 习 提供 不 同 的 选择 。 另 一 方面 ， 课 程 
也 有 责任 保证 ， 不 论 学 生 的 选择 是 什么 ， 都 能 学 到 计算 机 系统 (广义) 的 核心 知识 。 我 们 相信 
基于 本 书 的 课程 可 以 满足 这 样 一 种 系统 核心 知识 的 要 求 。 如 果 正 确 地 讲授 本 课程 ， 可 以 给 学 
生 提 供 充 足 的 机 会 ， 通 过 其 他 课程 来 深入 学 习 计 算 机 系统 。 例 如 ， 我 们 建议 在 大 学 二 年 级 开 
设 将 本 书 作为 教材 的 课程 。 在 大 三 的 时 候 ， 学 生 可 能 可 以 学 习 更 加 面向 设计 的 课程 一 一 针对 
体系 结构 、 操 作 系 统 或 是 网 络 一 一 以 他 们 在 大 二 从 本 书 中 学 到 的 基本 概念 为 基础 。 最 后 ， 在 
大 四 的 时 候 ， 学 生 可 以 选修 在 这 些 领 域 中 更 具 概 念 性 的 高 级 主题 课程 。 

本 书 在 体系 结构 和 操作 系统 的 内 容 方面 是 大 致 平衡 的 。 我 们 认为 ， 计 算 机 科学 专业 的 学 
生 在 本 科 期 间 应 该 对 这 两 方面 同等 重视 ,不管 他 们 的 职业 目标 是 什么 。 当 然 ， 希 望 成 为 系统 
架构 师 的 学 生 必须 了 解 本 书 中 介绍 的 软件 和 硬件 之 间 的 互动 。 即 使 是 希望 进行 软件 开发 的 学 
生 ， 了 解 这 些 知识 对 于 成 为 更 好 的 程序 员 也 是 必需 的 。 但 是 ， 这 取决 于 每 个 老师 对 这 两 个 主 
题 强调 的 程度 。 好 消息 是 ， 本 教材 允许 教师 选择 他 们 认为 必需 的 课程 深度 ， 以 与 他 们 所 在 学 
校 的 课程 结构 相 适 应 。 例 如 ， 如 果 教 师 选 择 减 少 体系 结构 方面 的 内 容 ， 可 以 很 轻松 地 简单 介 
绍 处 理 器 实现 的 有 关 音 节 (第 3 章 和 第 5 章 )， 而 不 必 担 心 内 容 的 衔接 问题 。 在 讨论 本 书 结构 
的 时 候 ， 我 们 已 经 对 五 个 模块 给 出 了 类 似 的 建议 。 








讲授 系统 的 集成 课程 的 补充 材料 

我 们 充分 理解 教师 在 讲授 需要 介绍 体系 结构 、 操 作 系 统 和 网 络 的 计算 机 系统 的 集成 课程 
时 所 面临 的 挑战 。 

为 此 ， 我 们 已 经 提供 了 一 组 在 线 资 源 。? 我 们 已 经 讲授 了 11 年 本 课程 ， 每 年 3 次 ， 作 为 
所 有 计算 机 专业 学 生 的 必修 课 ， 因 此 我 们 已 经 积累 了 相当 多 的 在 线 资 源 。 

1 ) 我 们 有 本 课程 所 有 内 容 的 PowerPoint 讲稿 ， 使 得 准备 课程 和 转换 (从 原 有 的 烟 秽 模 
型 ) 更 加 容易 。 

2) 每 个 模块 都 有 一 个 重要 的 实验 部 分 。 我 们 提供 了 这 些 已 经 兴 代 过 多 次 的 实验 的 详细 描 
述 ， 以 及 用 于 实验 特定 方面 的 软件 模块 〈 例 如 模拟 各 )。 

3) 除了 每 章 后 的 练习 题 之 外 ， 我 们 针对 本 课程 的 不 同 模块 还 有 附加 的 问题 集 、 家 庭 作 业 
以 及 本 课程 迄今 为 止 的 期 中 和 期 末 考 试题 . 


在 补充 材料 中 包含 的 样 例 实验 


处 理 器 设计 

我 们 给 学 生 提 供 一 个 完成 了 90% 的 处 理 器 数据 通路 设计 。 通 过 完成 数据 通路 可 以 帮助 学 生 
熟悉 相关 设计 。 然 后 他 们 要 设计 基于 微 码 的 控制 迎 辑 (使 用 类 似 LogicWorks 的 逻辑 设计 工具 )， 
利用 数据 通路 实现 一 个 简单 的 指令 集 。 这 能 帮助 学 生理 解数 据 通路 的 工作 原理 并 体会 一 些 设 计 权 
衡 。 学生会 得 到 真实 电路 设计 的 经 验 ， 并 通过 逻辑 设计 软件 内 置 的 模拟 器 对 设计 进行 功能 测试 。 
中 断 和 输入 / 输出 

学 生 在 第 一 个 实验 的 基础 上 增加 电路 以 实现 中 断 系统 。 然 后 他 们 (使 用 汇编 语言 ) 写 一 个 
中 断 处 理 程 序 。 实 验 的 电路 设计 部 分 再 次 通过 Logic Works 软件 系统 实现 并 进行 功能 模拟 。 此 
外 ， 我 们 还 给 学 生 提 供 了 处 理 需 模拟 器 ， 他 们 需要 在 其 中 增加 中 断 文 持 ， 并 与 他 们 用 汇编 语 
言 写 的 中 断 处 理 器 程序 一 起 工作 。 这 个 实验 不 仅 可 使 中 断 系统 的 操作 变 得 清晰 ， 还 展示 了 底 
层 设备 输入 /输出 的 基本 概念 。 
虚 存 子 系统 

学 生 在 处 理 器 模拟 需 上 实现 虚 存 子 系统 。 在 这 个 实验 中 ， 学 生 可 通过 实现 和 实验 不 同 的 
页 替换 策略 ， 获 得 开发 操作 系统 中 内 存 管理 部 分 的 经 验 。 这 个 实验 是 用 C 语言 实现 的 。 
多 线程 操作 系统 

在 我 们 提供 的 模拟 右上 ， 学 生 实现 多 线程 操作 系统 的 基本 模块 ， 包 括 CPU 和 LO 调度 队 
列 等 。 他 们 可 实验 不 同 的 处 理 器 调度 策略 。 这 个 模块 是 用 C 语言 和 pthread 实现 的 。 学 生 可 从 
实验 中 获得 并 行 编程 经 验 ， 并 接触 不 同 的 CPU 调度 算法 。 
可 靠 传 输 层 

学 生 在 我 们 提供 的 一 个 模拟 的 网 络 层 上 实现 一 个 简单 的 可 靠 传输 层 。 在 传输 层 必 须 处 理 
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的 问题 包括 损坏 的 包 、 丢 包 以 及 乱 序 到 达 。 这 个 实验 也 是 用 C 语言 和 pthread 实现 的 。 
注意 

在 开始 探索 计算 机 系统 内 部 的 旅程 之 前 ， 我 们 要 提醒 读者 注意 : 在 展示 计算 机 系统 设计 
的 教科 书 中 ， 习 惯 上 会 通过 有 数字 的 例子 来 说 明和 支持 相关 概念 。 历 史 可 以 揭示 未 来 。 如 果 
说 在 技术 发 展 中 有 什么 东西 不 变 的 话 ， 那 就 是 变化 。 当 你 买 了 一 辆 新 车 ， 在 车 驶 出 展厅 的 那 
一 刻 ， 这 辆 车 就 变 成 了 二 手 车 。 同 样 地 ， 我 们 使 用 的 任何 有 数字 的 例子 中 的 数字 ， 如 处 理 器 
速度 、 内 存 容 量 或 是 外 设 的 传输 速率 马上 就 会 过 时 。 丰 正 不 变 的 是 原理 ， 这 也 是 本 书 的 核心 
内 容 。 一 个 让 人 欣慰 的 因素 是 ， 尽 管 绝对 数字 可 能 会 随时 间 变 化 ， 从 MHz 到 GHz， 从 MB 
到 GB， 相对 数字 随 着 技术 的 发 展 相 对 保持 不 变 ， 这 使 得 书 中 的 数字 示例 也 具有 持久 性 。 


致谢 

我 们 极 大 地 受 惠 于 硅 干 国内 外 同行 ， 他 们 直接 或 间接 促成 了 本 书 的 出 现 。 首 先 ， 我们 要 
感谢 Yale Patt, M 2004 年 夏天 我 们 介绍 了 在 佐治 亚 理工 学 院 开设 的 这 门 课程 后 ， 他 用 具有 无 
与 伦比 的 说 服 力 的 方式 告诉 我 们 应 该 把 课程 的 内 容 写成 教材 ， 因 为 大 家 迫切 需要 一 本 用 集成 
方式 介绍 系统 概念 的 图 书 。 我 们 可 以 很 诚实 地 说 ， 如 果 没 有 他 的 茅 励 ,我们 可 能 不 会 走 上 写 
书 这 条 路 。 下 面 这 些 其 他 学 校 的 同行 也 鼓励 我 们 进行 本 书 的 写作 ， 因 此 需要 特别 致谢 : Jim 
Goodman ( 威 斯 康 竺 大 学 麦迪 逊 分 校 和 新 西 兰 奥克兰 大 学 )，Liviu Iftode ( Rutger KÆ), Phil 
McKinley (BAARIS KZ) 以 及 Anand Sivasubramaniam ( 宾 州 州立 大 学 和 TCS)。 我 们 要 特 
别 感谢 Jim Goodman， 他 仔细 阅读 了 本 书 手稿 的 早期 草稿 ， 并 提出 了 详细 的 反馈 ,使 本 书 的 
叙述 得 到 了 极 大 的 改进 。 除 了 这 些 人 以 外 ,我 们 还 从 其 他 学 校 的 一 些 同 行 那里 得 到 了 很 多 对 
本 书 实 验 的 积极 文 持 。 

写 书 的 第 一 步 是 创建 一 份 书稿 供 佐治 亚 理 工学 院 的 学 生 内 部 使 用 。 对 选择 佐治 亚 理工 学 
be CS 2200 课程 的 学 生 ， 我 们 怎么 感谢 也 不 为 过 。 从 2005 年 春季 学 期 开始 ， 几 代 学 生 使 用 了 
本 书 的 在 线 版 本 ， 并 提出 了 反馈 意见 ， 对 改进 本 书 表 达 的 清晰 性 、 精 炼 例题 、 提 供 读 者 可 能 
有 兴趣 的 历史 链接 等 起 到 了 重要 的 作用 。 此 外 ， 有 3 名 本 科 生 帮助 绘制 了 本 书 中 的 部 分 插图 : 
Kristin Champion, John Madden 和 Vu Ha. 

计算 机 学 院 的 部 分 同事 ， 包 括 Nate Clark, Tom Conte, Constantine Dovrolis, Gabriel 
Loh, Ken Mackenzie 以 及 Milos Prvulovic， 对 本 书 给 予 了 建议 和 有 洞察 力 的 评论 ， 帮 助 本 书 
的 叙述 更 加 清晰 。 我 们 受 惠 于 Constantine Dovrolis 对 本 书 网 络 一 章 早 期 版 本 的 建议 和 反馈 ， 
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计算 机 无 处 不 在 ， 从 手机 到 汽车 、 笔 记 本 电脑 、 桌 面 电 脑 ， 再 到 Google、eBay 和 
Amazon 等 搜索 引擎 背后 的 机 器 。 计 算 机 系统 架构 就 是 与 如 何 设计 上 面 每 一 类 计算 机 器 有 关 
的 内 容 。 在 计算 技术 的 早期 阶段 ， 软 件 系统 和 硬件 设计 之 间 有 清晰 的 区 分 。 然 而 ， 若 干 因素 
正 使 得 这 种 区 分 既 不 实际 ， 也 缺乏 效率 。 从 硬件 方面 来 看 ， 两 项 最 重要 却 又 相互 纠缠 的 进展 
是 心 片 功 耗 和 多 核 处 理 带 。 在 过 去 40 年 间 ， 处 理 器 的 处 理 能 力 一 直 在 不 断 增 长 ， 实 现 了 Intel 
的 联合 创始 人 Gordon Moore 在 1965 年 给 出 的 预测 : 芯片 密度 (间接 地 ， 指 处 理 速度 ) 大 概 每 
两 年 翻 一 倍 。 世 片 密度 和 处 理 速度 增加 的 副产品 是 芯片 的 功 耗 也 相应 增加 。 因 此 ， 近 年 来 系 
统 架 e 构 师 的 主要 精力 用 在 设法 将 更 多 处 理 需 放 在 同一 芯片 ro 
效率 ， 这 项 技术 用 计算 机 技术 的 行 话 来 说 叫做 多 核 (每 个 “ 核 ” PT ; 
都 是 一 个 独立 的 处 理 器 )。 与 此 同时 ， 软 件 技术 的 复杂 性 也 在 "a 
增长 : 如 今 计 算 技 术 已 经 渗透 到 我 们 日 常生 活 的 方方面面 。 从 
软件 方面 来 看 ， 应 用 程序 的 复杂 性 、 增 长 的 交互 性 、 实 时 响应 ， 
以 及 从 一 开始 而 非 事 后 才 需 要 考虑 并 行 性 是 几 个 重要 的 因素 。 
这 些 软件 和 人 硬件 方面 的 发 展 意味 着 再 也 不 能 将 对 方 视 为 黑 盒 。 
我 们 迫切 需要 培养 新 一 代 的 系统 架构 师 ， 能 够 理解 系统 软件 和 
计算 机 体系 结构 之 间 的 相互 关系 。 

不 管 最 后 的 职业 追求 是 什么 ,我们 越 早 将 这 种 软 人 硬件 之 间 
的 互动 介绍 给 学 生 ， 他 们 越 能 够 作为 计算 机 科学 家 更 好 地 武装 — 
A. 图 1-1 盒子 里 有 什么 


1.1 盒子 里 有 什么 


计算 机 是 由 处 理 需 (也 叫做 中 央 处 理 单元 ，Central Processing Unit, CPU) WATR., 
各 种 各 样 的 外 设 (例如 键盘 、 显 示 器 、 鼠 标 、 硬 盘 ， 以 及 DVD 播放 器 " )， 以 及 能 够 让 你 将 盒 
子 与 外 部 世界 相连 接 的 网 络 接口 组 成 的 。 另 外 计算 机 的 系统 软件 (例如 操作 系统 、 编 译 器 以 
及 高 级 编程 语言 的 运行 时 系统 ) 能 够 让 你 在 应 用 层 做 想 做 的 事情 。 在 本 书 中 ， 我 们 会 经 常用 
“盒子 ”来 代表 刚刚 定义 的 计算 机 系统 。 


1.2 计算 机 系统 中 的 抽象 层次 


让 我 们 来 看 一 个 你 可 能 熟悉 的 应 用 ， 比 如 说 谷歌 地 球 ( Google Earth, ILEI 1-2 )。 你 可 以 
在 图 形 用 户 界面 ( Graphical User Interface, GUI) 的 帮助 下 通过 在 地 球 地域 上 移动 鼠标 来 在 整 
个 地 球 表 面 上 浏览 。 你 可 以 将 鼠标 移动 到 任何 感 兴趣 的 区 域 (比如 说 珠 称 表 玛 峰 )， 然 后 单 击 
O DVD 代表 数字 多 用 途 盘 (Digital Versatile Disk) 或 数字 视频 盘 ( Digital Video Disk)， 它 使 用 光学 技术 存储 


海量 多 媒体 数据 ， 如 电影 文件 。 
© 图 1-1 是 一 张 有 趣 的 图 片 ， 展 现 了 人 们 在 打开 盒子 往 里 看 时 的 惊 至 。 
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限 祭 。 你 马上 就 可 以 在 屏幕 上 看 到 世界 上 最 高 山脉 的 3D 模型、 卫星 图 片 以 及 该 区 域 的 一 些 
照片 等 。 在 盒子 里 发 生 什么 事情 才能 带 给 你 这 样 的 视觉 体验 呢 ? 





图 1-2 谷歌 地 球 的 屏幕 截图 9 


再 考虑 一 个 更 复杂 一 些 的 例 于 ， 一 个 叫做 “棒球 ”的 多 人 视频 游戏 ( 见 图 1-3 )。 游 戏 的 
目标 非常 商 单 ， 即 比 别 的 队 获 得 更 多 的 分 数 以 最 得 比赛 。 但是， 实际 比赛 需要 复杂 的 规则 和 
处 加 措施。 





图 1-3 一 个 视频 游戏 (棒球 ) 


我 们 考虑 开发 这 个 应 用 的 软件 体系 结构 。 想 象 有 一 个 〈 逻 辑 上 的 ) 中 心软 件 组 件 ， 我 们 称 
其 为 服务 器 ， 它 负责 维护 游戏 的 状态 。 每 个 玩家 也 由 一 个 软件 组 件 代 表 ， 我 们 称 其 为 客户 端 。 
由 于 这 是 一 个 多 人 视频 游戏 ， 客 户 端 和 服务 硕 并 不 在 同一 台 机 希 上 执行 ， 它 们 在 由 局 域 网 连 
接 起 来 的 不 同 机 需 上 执行 。 这 类 应 用 程序 很 自然 地 应 该 用 高 级 语言 (High Level Language, 
HLL) 编程 。 

我 们 可 能 会 给 正在 设计 的 游戏 添加 一 些 音 频 / 视频 的 内 容 。 正 如 你 在 图 1-4 中 所 见 ， 要 让 
视频 游戏 软件 能 运行 ， 除 了 我 们 自己 编写 的 代码 (在 图 右 侧 的 灰色 方 框 中 )， 还 需要 很 多 其 他 
部 分 的 协同 。CPU 显然 不 懂 机 顺 语 言 外 的 任何 其 他 语言 ， 因 此 编译 需 必 须 将 高 级 语言 程序 翻 
译 成 处 理 器 能 理解 的 指令 集 ， 程 序 才 能 在 处 理 需 便 件 上 执行 。 

现在 我 们 来 自 底 向 上 地 了 解 一 下 处 理 器 (图 1-4 的 左 侧 )。 在 抽象 层次 的 最 底层 ， 是 构 
成 半导体 基底 的 电子 和 洞穴 。 唱 体 管 抽 象 层 给 电子 和 洞穴 的 狂 野 世界 傍 来 了 秩序 。 逻 和 辑 门 
巾 晶 体 管 构成 。 组 合 和 顺序 逻辑 单元 是 由 基本 的 逻辑 门 组 成 的 ， 并 进一步 组 织 成 数据 通路 
(datapath)。 有 限 状 态 自 动机 控制 着 数据 通路 以 实现 处 理 需 指令 集体 系 结构 中 指令 的 能 力 。 因 


© ©2010 Google Earth. 
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而 指令 集 是 软件 和 硬件 的 交汇 点 。 处 理 器 需要 面向 指令 集 生 成 可 以 在 处 理 器 上 运行 的 代码 ; 
软件 并 不 关心 指令 集 在 人 硬件 上 是 如 何 实现 的 。 类 似 地 ， 硬 件 实现 并 不 关心 处 理 器 上 运行 的 程 
序 是 什么 ， 而 只 是 简单 地 在 硬件 上 履行 指令 集体 系 结构 所 指定 的 软件 和 硬件 之 间 的 “合同 ”。 


硬件 软件 





电子 和 洞穴 


图 1-4 硬件 /软件 接口 。 左 半边 展示 了 硬件 的 抽象 层次 ， 从 底部 的 电子 和 洞穴 到 顶部 的 
指令 集 。 指 令 集 是 硬件 和 软件 之 间 的 “合同 ”。 右 半边 展现 了 视频 游戏 这 样 的 应 
用 从 概念 到 实现 所 需 的 软件 组 件 


正如 你 看 到 的 ， 连 续 的 抽象 层次 〈 指 令 集 、 数 据 通路 和 控制 、 逻 辑 单元 、 门 以 及 品 体 管 ) 
允许 我 们 使 用 高 级 语言 程序 控制 半导体 基层 上 的 电子 和 洞穴 的 概率 性 行为 。 图 1-5 展示 了 联 
网 的 视频 游戏 是 如 何 通 过 这 些 抽象 层次 来 控制 半导体 基层 上 的 电子 和 洞 人 六 的 。 这 就 是 抽象 的 
威力 。 抽 象 是 处 理 系统 复杂 性 的 一 种 核心 方法 ， 而 不 管 是 软件 子 系统 还 是 硬件 子 系统 。 图 1-4 
和 图 1-5 都 展示 了 通过 一 系列 抽象 层 将 高 级 语言 程序 转化 为 可 以 在 处 理 句 上 执行 代码 的 概念 
性 步骤 。 

现在 我 们 回 到 联网 视频 游戏 的 例子 ， 了 解 一 下 操作 系统 在 游戏 开发 生命 周期 以 及 玩家 真 
正 玩 游戏 时 的 作用 。 


1.3 ”操作 系统 的 作用 


操作 系统 在 网 络 视频 游戏 开发 和 实际 使 用 中 的 角色 是 什么 ”操作 系统 是 资源 管理 器 ， 负 
责 协 调 从 游戏 设计 到 实际 运行 游戏 的 过 程 中 全 部 行为 的 硬件 资源 使 用 。 

我 们 用 联网 视频 游戏 作为 例子 来 理解 程序 的 开发 和 部 署 生 命 周 期 。 我 们 已 经 使 用 高 级 语 
言 编写 了 客户 端 - 服 务 器 程序 。 我 们 可 以 用 简单 的 文本 编辑 器 ， 也 可 以 使 用 复杂 的 程序 开发 
工具 如 Visual Studio 来 开发 视频 游戏 。 一 旦 游戏 开发 完毕 ， 我 们 就 将 程序 编译 成 处 理 需 的 指 
令 集 。 文 本 编辑 器 、 编 译 器 以 及 在 程序 开发 中 需要 用 到 的 其 他 程序 工具 都 需要 在 处 理 般 上 运 
行 。 例 如 ， 编 译 器 必须 在 处 理 器 上 运行 ， 将 高 级 语言 程序 作为 输入 ， 输 出 机 器 语言 代码 。 操 
作 系 统 要 为 每 个 程序 的 开发 过 程 分 配 处 理 器 资源 。 现 在 让 我 们 来 看 看 在 玩 游戏 的 时 候 会 发 生 
什么 事情 。 

在 视频 游戏 中 ,， 单 击 鼠 标 按键 使 得 击 球 手 三 振 出 局 ， 并 显示 在 你 的 屏幕 和 其 他 每 个 玩家 
的 屏幕 上 ( 见 图 1-6 )。 这 其 中 发 生 了 什么 事情 ? 首先 ， 你 的 计算 机 里 的 硬件 设备 控制 疮 记录 
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了 你 的 鼠标 单 击 行为 。 控 制 硕 随后 产生 了 一 个 处 理 器 中 断 。 请 记 住 处 理 器 正在 执行 你 的 游戏 
客户 闪 程 序 。 中 断 是 一 种 便 件 机 制 ， 通 知 处 理 需 在 正 执行 的 程序 之 外 发 生 了 需要 关注 的 事情 。 
这 种 机 制 有 点 类 似 于 房间 的 门铃 。 必 须 有 人 去 看 谁 在 按 门铃 ， 他 要 做 什么 。 操 作 系 统 (也 是 
一 组 程序 ) 将 目 己 调度 到 处 理 希 上 运行 ， 以 回应 按 铃 。 操作 系统 回应 按 铃 ， 发 现 其 来 自 鼠 标 ， 


-其 目标 是 游戏 客户 半 程 序 ， 并 将 这 个 中 断 传递 给 客户 端 程序 。 客 户 端 程序 将 这 个 中 断 打包 成 


一 个 消息 ,通过 网 络 发 送 给 服务 硕 端 程序 。 服 务 需 端 程序 处 理 这 个 消息 ， 使 用 新 的 消息 更 新 
洲 戏 状态 。 客 户 端 程序 通过 其 各 目的 操作 系统 ， 更 新 各 自 的 屏幕 以 反映 新 的 世界 的 状态 。 我 
们 可 以 看 到 ， 在 从 鼠标 单 击 到 显示 屏幕 更 新 的 这 段 时 间 里 ， 系 统 分 配 和 释放 了 多 种 硬件 资 源 
(处 理 需 、 程 序 和 数据 所 需 的 内 存 、 鼠 标 、 显 示 占 、 网 络 连接 等 )。 操 作 系 统 负责 协调 所 有 这 
些 动作 。 





图 1-5 从 电子 和 洞穴 到 多 用 户 视频 游戏 。 视 频 游戏 应 用 通过 硬件 抽象 的 各 个 层次 驱 
动 电子 和 洞穴 完 成 它 所 硕 望 的 操作 


| 游戏 玩家 点 击 鼠 标 投球 


操作 系统 : AM ERIS oe 操作 系统 更 新 显示 屏幕 ， 展 


客户 端 程序 示 三 振 出 局 ! ! 


操作 系统 : 接收 
到 消息 并 转发 给 
客户 端 程序 


图 1-6 ”分布 式 视频 游戏 中 的 应 用 - 硬件 -操作 系统 交互 。 交 互 发 生 在 客户 端 和 服务 器 端 
的 应 用 程序 、 操 作 系 统 以 及 于 其 上 执行 的 硬件 之 间 


14 盒子 里 正在 发 生 什么 事 


可 以 把 视频 游戏 的 例子 作为 问题 来 驱动 我 们 进一步 理解 应 用 程序 、 操 作 系统 和 硬件 之 间 
的 交互 。 对 我 们 来 说 要 更 好 地 理解 盒子 里 正在 发 生 什 么 事 ， 需 要 很 好 地 掌握 系统 软件 和 硬件 
体系 结构 的 行为 。 

首先 ， 理 解 计算 机 系统 有 多 种 实现 形式 是 有 益 的 。 计 算 机 系统 的 实现 形式 包括 手持 设备 
(如 手机 或 个 人 数字 助理 (PDA) S)、 平板 电脑 、 笔 记 本 电脑 、 桌 面 电 脑 、 并 行 计算 机 、 集 群 
计算 机 以 及 超级 计算 机 等 ， 如 图 1-7 所 示 。 

尽管 这 些 计算 机 系统 的 外 观 和 大 小 不 同 ， 但 其 内 部 的 硬件 组 织 结构 在 很 大 程度 上 是 相同 
的 。 其 中 包括 一 颗 或 多 颗 中 央 处 理 单元 (CPU)、 内 存 以 及 输入 /输出 设备 。 将 这 些 部 件 连接 起 
来 的 管道 叫做 总 线 (bus)， 设 备 控制 器 则 在 CPU 和 相关 外 设 之 间 起 中 介 作 用 。 这 些 计算 机 的 计 


© PDA (Personal Digital Assistant) 即 个 人 数字 助理 ， 用 来 统称 手机 、 传 呼 机 等 。 





算 能 力 、 内 存 容 量 以 及 输入 /输出 (IO) 设备 的 种 类 和 数量 可 能 有 很 大 不 同 。 例 如 ，PDA 拥有 
与 其 用 途 匹 配 的 有 限 VO 能 力 ， 包 括 触 摸 屏 、 麦 克 风 以 及 扬声器 。 用 来 运行 大 规模 科学 计算 应 
用 (如 气候 变化 建 模 ) 的 高 端 超级 计算 机 则 可 能 包括 成 千 上 万 个 CPU、 多 达 数 个 TB s 的 内 存 和 
具有 PB 级 存储 容量 的 磁盘 阵列 S98。 图 1-8 展示 了 典型 的 桌面 计算 机 系统 的 硬件 组 织 . 








图 1-7 从 PDA 到 超级 计算 机 。 各 种 计算 机 系统 的 实例 ， 从 手持 设备 到 占据 了 整 层 建筑 
空间 的 超级 计算 机 ， 例 如 像 Yahoo AI Google 这 样 的 搜索 引擎 公司 或 是 在 国家 实 
验 室 里 进行 气候 变化 模拟 的 服务 硕 集 群 


图 形 控制 
(cw) | 


VO 总 线 


i Pra 


4 





图 1-8 桌面 计算 机 的 硬件 组 织 。 尽 管 有 多 种 多 样 的 计算 平台 ， 但 计算 机 系统 的 基本 组 成 
是 非常 相似 的 。 注意 这 种 组 织 形 式 使 得 可 以 在 硬件 组 件 上 同时 支持 多 个 操作 
© 1TB (Terabyte) =2” 字 节 (有 时 ，1TB 也 用 来 表示 10” 字 节 ) 
© 1 PB (Petabyte) =2” 字 节 (有 了 时，1PB 也 用 来 表示 10” 字 节 ) 
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计算 机 的 便 件 组 织 形式 揭示 了 在 刹 件 单元 上 同时 进行 操作 的 可 能 性 ( 即 并 发 性 )。 例 如 ， 
在 打印 机 打印 文档 的 时 候 ， 硬盘 可 以 读 取 MP3 文件 以 播放 你 喜欢 的 音乐 ， 而 此 时 你 正在 用 
Web 浏览 右 阅 读 CNN 9 的 新 闻 故 事 。CPU 是 整个 系统 的 大 脑 。 计 算 机 系统 里 发 生 的 每 件 事 都 
是 在 CPU 上 运行 菜 些 程序 的 结果 。 你 可 能 会 观察 到 ， 在 你 从 计算 机 屏幕 上 看 CNN 的 同时 ， 
文档 编辑 程序 正 通 过 打印 机 打印 你 的 文档 。Web 浏览 器 是 一 个 应 用 程序 ， 文 档 编 辑 器 也 是 应 
用 程序 。 操 作 系统 为 每 个 应 用 程序 分 配 CPU 时 间 ， 以 触发 其 动作 。 因 此 ， 图 1-8 所 示 的 计算 
机 组 织 方式 所 支持 的 并 发 性 在 实际 中 得 到 了 实现 。 


1.4.1 在 计算 机 上 启动 应 用 程序 


让 我 们 来 理解 图 1-8 中 的 各 个 部 件 如 何 整 合 起 来 ， 与 操作 系统 一 起 为 你 提供 简单 的 计算 
体验 一 一 比如 在 显示 设备 上 看 视频 。 下 面 的 描述 为 了 讲解 方便 特意 进行 了 简化 。 图 中 标 有 
“内 存 ” 的 方 框 存储 着 要 在 CPU 上 执行 的 所 有 程序 。 在 没有 任何 用 户 程 序 的 情况 下 ， 操 作 系 
统 (其 自身 也 是 一 个 程序 ) 总 是 在 CPU 上 执行 ， 并 随时 准备 执行 用 户 想 要 计算 机 系统 执行 的 
任务 。 首 先 , 使 用 鼠标 在 显示 设备 上 点 击 标 有 “电影 播放 此 ”的 图 标 。 鼠 标的 移动 和 鼠标 点 
击 都 被 操作 系统 接收 ， 操 作 系 统 通过 被 点 击 的 图 标 得 知 用 户 要 执行 的 是 哪个 程序 。 所 有 的 程 
序 都 在 某 个 存储 设备 上 保存 着 ， 最 常见 的 情况 是 保存 在 计算 机 的 硬盘 上 。 操 作 系 统 将 电影 
放 器 的 可 执行 镜像 “加 载 ” 到 内 存 中 并 将 CPU 的 控制 权 转 移 以 启动 这 个 程序 的 执行 。 

电影 播放 程序 的 执行 结果 是 ， 显 示 器 上 打开 了 一 个 图 形 窗口 ， 并 请 你 指定 要 看 的 电影 文 
件 。 你 可 能 会 使 用 键盘 来 打出 文件 的 名 称 ， 包 括 文件 所 在 的 盘 符 (例如 DVD 驱动 器 )。 该 程 
FETE DVD 驱动 器 上 打开 文件 并 播放 ， 现 在 你 可 以 在 显示 设备 上 观看 喜爱 的 电影 了 。 操 作 系统 
参与 了 给 你 提供 观 影 体 验 的 每 一 个 步 又， 包括: (a) 刷新 图 形 显示 ,(b) 捕获 用 户 的 键盘 输入 
并 转交 给 电影 播放 器 程序 ，( c) 将 数据 从 诸如 DVD 驱动 器 之 类 的 存储 设备 移动 到 内 存 中 。 将 
数据 在 IO 设备 和 内 存 之 间 移 动 的 实际 机 制 取 决 于 设备 的 特性 。 我 们 将 在 第 10 ANA IO F 
系统 的 时 候 在 这 方面 展开 更 详细 的 讨论 。 

图 1-8 中 的 VO 总 线 和 系统 总 线 的 作用 是 作为 多 种 便 件 单元 之 间 数 据 移动 的 通道 。 正 如 高 
速 公 路 和 地 面 道路 有 不 同 限 速 一 样 ， 这 些 不 同 的 总 线 在 传输 数据 的 时 候 也 会 有 不 同 的 速度 特 
性 。 图 1-8 中 标 有 “ 桥 ” 的 方 框 就 是 用 于 平滑 计算 机 系统 组 成 中 不 同 通道 的 速度 差异 。 


1.5 计算 机 硬件 的 演化 


现在 计算 在 日 常生 活 中 已 无 处 不 在 ， 很 难 想象 计算 机 还 是 稀罕 物 的 时 代 。 但 要 达到 你 现 
在 花 不 到 1000 美元 买 的 笔记 本 电脑 的 计算 能 力 ， 不 久之 前 要 花费 100 万 美元 ， 需 要 一 个 大 舞 
池 的 空间 ， 还 需要 精心 地 制冷 以 及 垫 高 的 地 板 以 便 走 线 。 

在 20 世纪 40 年 代 早 期 ，ENIAC (Electronic Numerical Integrator and Computer, HE F% 
值 积分 器 和 计算 机 ) 在 宾夕法尼亚 大 学 建成 。ENIAC 被 广泛 认可 为 第 一 人 台 可 编程 电子 数字 计 
FAL OLEI 1-9 )。 

ENIAC 由 18 000 只 真空 管 S 和 1000 位 铁 氧 体 磁 芯 (通常 称 作 “ 磁 忌 存储 融 ”) 组 成 的 随 
机 存储 器 ， 功 率 大 约 是 170 千瓦 ， 其 计算 能 力 与 今天 的 音乐 贺卡 计算 能 力 相 当 ! 可 以 看 出 在 

© MP3 表示 MPEG-1 音频 层 3， 是 存储 数字 音乐 的 事实 标准 : 


© CNN 是 一 家 总 部 在 美国 亚特兰大 市 的 新 闻 网 公司 
四 “真空管 ， 由 密封 在 小 真空 腔 管 (通常 是 玻璃 制 成 ) 中 的 电极 组 成 ， 在 半导体 革命 前 被 用 作 数 字 开 关 设 备 。 


8 
? 
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ENIAC 出 现 后 60 多 年 的 时 间 内 ， 计 算 技术 的 发 展 有 多 快 





图 1-9 第 一 台电 子 数 字 计 算 机 ENIAC 号。 由 美国 军 方 资助 并 在 宾夕法尼亚 大 学 秘密 建 
造 ， 是 世界 上 第 一 人 台 计 算 机 ， 主 要 通过 计算 来 支持 二 次 大 战 中 盟 军 的 行动 


计算 机 硬件 技术 的 高 速 发 展 归功 于 物理 、 化 学 、 电气 工程 、 数 学 和 计算 机 科学 等 多 
个 领域 的 科学 家 和 工程 师 的 聪明 才智 。 当然 ， 半 导体 羊 命 是 推动 计算 机 工业 飞速 发 展 
的 最 显著 的 技术 因素 。20 世纪 40 年 代 ， 数 字 计 算 机 刚刚 出 现时 使 用 真空 管 和 磁 必 存储 
器 。1947 年 ， 贝 尔 实验 室 发 明了 一 种 叫做 晶体 管 9 的 开关 设备 ， 半 导体 革命 开始 初 现 端 
倪 。 随 后 ， 使 用 分 立 唱 体 管 建造 数字 计算 机 的 方法 让 位 于 将 多 个 晶体 管 集成 在 一 个 硅 片 
上 。 微 芯片 的 出 现 一 一 20 世纪 80 年 代 和 90 年 代 ， re GERI Waters averse 
( Very Large Scale Integration, VLSI) 技术 制 成 的 单 必 片 处 可 能 是 计算 机 硬件 
革命 的 引爆 点 ( 中 图 110 ) 。 今 天 ， 从 手机 到 超级 计算 机 的 每 个 计算 设备 都 使 用 微 芯片 
作为 基本 构建 单元 ， 半 导体 内 存 (通常 容量 为 数 百 兆 乃至 千 兆 字 市 ) 已 经 完全 代 蔡 了 磁 
芯 存 储 器 〈( 见 图 1-11 ) 
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图 1-10 ”从 真空 管 到 晶体 管 到 微 芯 片 。 基 本 开关 单元 的 演化 使 得 单个 处 理 器 从 整个 房间 
大 小 缩小 到 硬币 大 小 





图 片 获得 了 宾夕法尼亚 大 学 工程 和 应 用 学 院 的 使 用 许可 

1956 年 ， 唱 体 管 的 发 明 人 John Bardeen, Walter H. Brattain 和 William Shockley 由 于 在 贝尔 实验 室 所 做 的 
开创 性 工作 获得 了 诺 贝 尔 物 理学 奖 

© CMOS (Complementary Metal-Oxide Semiconductor) 即 互 补 型 金属 氧化 物 半 导体 ， 在 集成 电路 (IC) 上 该 
技术 广泛 用 于 实现 品 体 管 
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图 1-11 BARES Fei a BIE SE AR Fe. 内存 技 术 的 进化 使 得 一 块 泡泡糖 大 小 的 芯片 可 以 
存储 数 百 万 位 


1.6 操作 系统 的 演化 


操作 系统 的 演化 与 处 理 需 的 演化 以 及 围绕 处 理 需 构建 的 计算 机 系统 的 演化 相 吻 合 。 操 作 
系统 在 20 世纪 50 年 代 出 现 ， 例 如 FMS (Fortran Monitoring System, Fortran 监控 系统 ) 和 
IBSYS (IBM 7094 操作 系统 )。 今 天， 操作 系统 存在 于 如 图 1-7 所 示 的 多 种 计算 设备 上 。 微 软 
的 Windows 和 Mac OS 主导 了 晶 面 计算 机 市 场 。Linux 则 在 企业 市 场 站 稳 了 脚跟 。 和 瞬 入 式 设 
备 如 手机 或 个 人 数字 助理 (PDA) 有 它们 自己 独特 的 需求 ， 因 此 出 现 了 满足 其 需求 的 专业 化 操 
作 系 统 。 专 业 化 竺 入 式 操 作 系 统 的 例子 包括 Symbian OS ( 塞 班 操 作 系 统 ) 和 Blackberry OS ($ 
等 操作 系统 )。 许 多 藤 入 式 操作 系统 是 有 果 面 操作 系统 的 衍生 物 ， 例 如 iOS 和 Windows CE. 

可 以 根据 操作 系统 所 支持 的 计算 机 系统 以 及 用 户 日 益 增 长 的 期 望 来 追踪 操作 系统 的 演 
化 。 批 处 理 操作 系统 支持 大 型 主机 系统 。 多 任务 操作 系统 能 够 更 好 地 利用 大 型 机 和 小 型 机 
的 硬件 资源 。 分 时 操作 系统 则 用 于 满足 用 户 交 互 式 使 用 计算 机 系统 的 期 望 。 随 着 个 人 计算 
机 和 图 形 用 户 界面 的 出 现 ，PC 操作 系统 中 集成 了 图 形 用 户 界 面 ， 例 如 微软 的 Windows 95 
及 其 后 继 者 9. 

最 终 ， 操 作 系 统 要 向 用 户 提供 计算 资源 ， 如 处 理 能 力 、 内 存 、 存 储 以 及 其 他 VO 设备 等 。 
最 近 出 现 的 趋势 是 通过 因特网 访问 这 些 计 算 资 源 。 网 格 计算 是 这 种 趋势 的 开始 ， 它 是 一 个 纯 
粹 的 科研 行为 ， 目 标 是 通过 因特网 在 不 同 管理 主体 之 间 共 享 高 性 能 计算 资源 。 网 格 计 算 这 个 
词 源 自 电力 通过 电网 来 传输 并 进入 千家 万 户 ， 象 征 着 计算 能 力也 应 该 像 电力 一 样 随处 可 得 。 
今天 ， 一些 公司 如 亚马逊 和 微软 正在 通过 Web 提供 计算 资源 (处 理 能 力 和 存储 )。 云 计算 是 一 
个 商业 界 的 流行 语 ， 用 来 描述 这 种 给 最 终 用 户 提供 计算 资源 的 新 方式 。 


1.7 本 书 导读 


对 计算 机 系统 爱好 者 来 说 ， 这 是 激动 人 心 的 时 刻 。 本 概述 明确 展示 了 计算 机 硬件 和 系统 
软件 之 间 的 紧密 关系 。 与 此 相对 应 ， 在 本 书 的 其 余部 分 也 以 一 种 集成 的 方式 介绍 了 有 关 处 理 
器 、 内 存 、ILO 、 并 行 系统 以 及 网 络 的 人 硬件 和 软件 问题 。 

第 一 部 分 AMEE 

第 2 ~ 5 章 探讨 了 处 理 需 设计 和 相关 人 硬件 问题 。 

第 6 章 介 绍 了 处 理 器 调度 问题 以 及 如 何 用 操作 系统 解决 这 些 问 题 。 

第 二 部 分 “内存 子 系统 

第 7 ~ 8 章 提 出 了 内 存 管理 问题 ， 以 及 操作 系统 如 何在 相应 的 体系 结构 的 支持 下 解决 这 


O 有 兴趣 的 读者 可 以 看 一 下 名 为 《 书 果 子 的 胜利 》( Triumph of the Nerds) 的 纪录 片 (由 美国 公共 广播 电台 
1996 年 制作 并 播 出 ) 以 了 解 个 人 计算 机 革命 : www.pbs.org/nerds/。 可 以 通过 Google 视频 看 到 这 部 纪录 片 。 
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第 9 章 介 绍 了 内 存 层次 ， 特 别 是 关于 处 理 器 缓存 。 

第 三 部 分 IJ/O 子 系统 

第 10 章 以 磁盘 子 系统 为 重点 介绍 了 VO 的 一 般 性 问题 ， 即 如 何 与 处 理 器 接口 。 

第 11 章 讨 论 了 文件 系统 的 设计 和 实现 。 文 件 系统 是 操作 系统 的 一 个 重要 组 成 部 分 ， 用 来 
管理 持久 化 存储 。 

第 四 部 分 ”并行 系统 

第 12 章 介绍 了 与 并 行 处 理 需 有 关 的 编程 、 系 统 软件 和 人 硬件 问题 。 


第 五 部 分 ”网络 
第 13 章 讲解 了 设计 网 络 协议 栈 时 过 到 的 操作 系统 问题 ， 以 及 相关 的 硬件 支持 。 
练习 题 


1. 考虑 谷歌 地 球 (Google Earth) 应 用 。 打 开 程 序 ， 将 鼠标 放 到 地 球 表 面 上 ， 点 击 珠穆朗玛 峰 以 仔细 观察 
这 个 山岭 。 确 定 并 用 非 专业 术语 描述 在 这 一 系列 动作 中 操作 系统 和 硬件 之 间 的 交互 。 

2. 高 级 语言 是 如 何 影 响 处 理 需 体系 结构 的 ? 

3. 对 下 面 的 问题 回答 是 或 否 ， 并 说 明 原 因 : 编译 器 设计 者 深入 了 解 处 理 器 实现 的 细节 。 

4. 解释 计算 机 中 的 抽象 层次 ， 从 硅 基 片 到 复杂 的 多 人 视频 游戏 。 

5. 对 下 面 的 问题 回答 是 或 否 ， 并 说 明 原 因 : 计算 机 系统 内 部 的 硬件 组 织 结构 根据 系统 特性 的 不 同 有 巨大 
差别 。 

6. 图 1-8 中 计算 机 总 线 之 间 的 “ 桥 ” 的 作用 是 什么 ? 

7. 图 1-8 中 “控制 缮 ”的 作用 是 什么 ? 

8. 使 用 因特网 ， 研 究 并 解释 计算 机 硬件 演化 的 5 个 主要 里 程 碑 。 

9. 使 用 因特网 ， 研 究 并 解释 操作 系统 演化 的 5 个 主要 里 程 碑 . 

10. 对 比 网 格 计算 和 电网 。 解释 为 什么 用 电网 来 比喻 网 格 计算 是 有 道理 的 。 同 样 ， 解 释 它 们 之 间 的 不 同 。 

11. 连 线 题 。 请 在 左右 两 边 各 选择 合适 的 项 目 连 线 。 


UNIX 操作 系统 Torvalds 

微 必 Bardeen, Brattain 和 Shockley 
FORTRAN 语言 Kilby 和 Noyce 

CHA De Forest 

品 体 管 Lovelace 


世界 上 最 早 的 程序 员 。 Thompson 和 Ritchie 
世界 上 最 早 的 计算 机 各 Mauchley 和 Eckert 


真空 管 Backus 

ENIAC Ritchie 

Linux 操作 系统 Babbage 
参考 文献 注释 和 扩展 阅读 


冯 ， 诺 依 曼 结 构 已 经 成 为 存储 程序 计算 机 的 同义词 ， 它 由 CPU 及 存储 了 指令 和 数据 的 内 存 构成 。 
但 计算 机 历史 学 家 对 这 两 者 之 间 的 联系 还 存在 争论 。 冯 : 诺 依 曼 模 型 的 概念 是 由 John von Neumann 于 
1945 年 在 一 篇 广 为 传 播 的 论文 中 提出 的 ， 这 个 模型 实际 上 受到 了 宾夕法尼亚 大 学 的 J. Presper Eckert 和 
John Mauchly 开发 的 ENIAC 体系 结构 的 启发 。 在 ENIAC 之 前 ,一 位 名 叫 Alan Turing 的 数学 家 在 1936 
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年 写 了 一 篇 文章 ， 假 设 了 一 种 “通用 计算 机 器 ”。 这 个 假设 的 机 器 具有 无 穷 内 存 以 存储 指令 和 数据 。 今 
天 ， 这 个 假设 的 机 天 以 他 的 名 字 被 命名 为 “图 灵机 ”， 并 已 成 为 理论 计算 机 科学 的 基础 。Alan Turing 被 
认为 是 “理论 计算 机 科学 之 父 ”， 每 年 ACM 都 为 在 计算 机 科学 领域 做 出 持久 性 贡献 的 个 人 颁发 久 负 盛 
名 的 图 灵 奖 。 图 灵 奖 被 认为 与 诺 贝 尔 奖 齐名 ， 

阅读 一 些 真正 经 典 的 文献 以 了 解 从 前 的 思维 过 程 总 是 很 有 意思 。John Backus 和 他 的 团队 在 1953 年 向 
他 IBM 的 上 司 提出 了 FORTRAN 语言 ， 最 早 的 关于 FORTRAN 语言 的 论文 出 现在 1954 年 [Backus，1954]。 
Backus 于 1977 年 因此 获得 了 图 灵 奖 。ENIAC 结构 是 Eckert 和 Mauchly 于 1943 年 构思 的 ， 描 述 ENIAC 的 文 
莉 可 以 在 IEEE « Annals of the History of Computing 》( 计 算 历 史 年 刊 ) 上 找到 [Burke, 1981]. 

Charles Babbage 被 认为 是 “计算 机 之 父 ”， 他 生 于 1791 F, F 1871 年 ， 发 明了 第 一 台 机 械 计算 
机 ( 称 作 差分 机 ) 一 一 使 用 轮子 和 齿轮 来 进行 通过 穿孔 卡 输入 的 简单 计算 。Ada Lovelace 常 被 称 作 世 界 
上 第 一 个 计算 机 程序 员 ， 他 生 于 1815 年 ， 座 于 1852 年 ， 给 Babbage 的 分 析 机 (在 其 一 生 中 从 未 完成 ) 
写 了 第 一 个 算法 。 这些 都 发 生 在 计算 机 革命 的 初期 。 

Jack Kilby 在 1958 年 发 明 的 集成 电路 或 微 芯 片 (Robert Noyce 在 6 个 月 后 也 独立 发 明了 ) 则 启动 了 
“真正 ”的 计算 机 革命 ， 在 T. R. Reids 的 书 中 有 相应 记载 [Reid，2001]。 下 面 展示 了 Gordon Moore 于 
1965 年 在 《 Electronic 》( 电 子 ) 杂志 上 发 表 的 文章 中 的 图 表 [Moore，1965] ， 显 示 了 他 对 芯片 密度 与 时 
间 之 间 关 系 的 函数 的 预测 : 


(每 个 集成 的 功能 中 的 组 件数 ) 


—- NWS AaADN OW 


Log’ 





贝尔 实验 室 的 Dennis Ritchie 和 Ken Thompson JF & Y UNIX 操作 系统 [Ritchie，1974]。 贝 尔 实验 室 
的 Brian Kernighan 和 Dennis Ritchie 开发 了 C 语言 [Kemighan, 1978], {f= Vrije 大 学 (荷兰 自由 大 学 ) 的 
Andrew Tanenbaum 开发 了 一 个 开源 版 本 的 UNIX 操作 系统 ,叫做 MINIX ( MIni-uNIX 的 缩写 )， 并 在 1987 年 
作为 其 广 受 推崇 的 操作 系统 教材 的 附录 公布 [Tanenbaum，1987]， 这 促成 了 一 个 关于 操作 系统 的 用 户 社区 的 
诞生 。 一 个 名 叫 Linus Torvalds 的 芬兰 学 生 ， 受 到 MINIX 的 启发 ， 开 发 了 其 自己 版 本 的 开源 UNIX 操作 系 
统 ， 并 在 1991 年 以 Linux 为 名 在 comp.os.minix 邮件 组 通过 一 条 简短 而 低调 的 消息 发 布 [Torvalds，1991]。 

我 们 用 一 些 近 期 操作 系统 的 参考 文献 来 结束 本 章 。Windows 7 是 微软 在 PC 平台 上 的 最 新 产品 
[Windows Version 7，2010] 9。 微软 的 Windows CE (CE 是 简洁 版 的 意思 ，Compact Edition) 主要 面向 窒 
入 式 应 用 ,例如 医疗 设备 、 汽 车 以 及 移动 电话 [Windows CE，2010]。 苹 果 的 PC 平台 [Mac OS X, 2010] 
和 iPhone[iPhone OS X, 2010] 有 自己 的 操作 系统 。Symbian OS[Symbian OS, 2010] 是 一 个 在 智能 手机 
上 流行 的 开源 操作 系统 。 黑 莓 OS 是 RIM 公司 为 黑 葡 手机 设计 的 专 有 软件 平台 [Blackberry OS, 2010]. 


© i Gordon Moore 在 ISSCC 2003 会 议 上 的 大 会 报告 ,“ 没 有 永远 的 指数 (增长 ， 摩 尔 定律 50 周年 ，Intel 
公司 。http://sscs.org/History/MooresLaw.htm。 


日 ” 指 本 书 英文 版 出 版 时 。 泽 者 注 
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处 理 怖 设计 围绕 两 个 体系 结构 的 问题 : 指令 集 和 机 器 结构 。 在 计算 机 发 展 的 早期 (大 约 
是 20 世纪 60 年 代 和 70 年 代 )， 兽 有 一 段 时 间 处 理 需 设计 完全 被 看 作 电 子 工程 师 的 工作 。 计 
算 机 上 大 规模 地 使 用 汇编 语言 编程 ， 因 此 ， 指 令 集 越 是 花哨 ， 应 用 程序 就 越 趋向 简单 。 这 是 
当时 流行 的 传统 观念 。 随 着 现代 编程 语言 的 出 现 一 一 如 20 世纪 60 年 代 的 Algol 语言 以 
及 编译 技术 的 快速 发 展 ， 处 理 需 设计 显然 不 再 仅仅 是 一 项 关于 硬件 的 工作 。 特 别 地 ， 指 令 集 
的 设计 与 编译 器 如 何 有 效 地 为 处 理 器 生成 代码 密切 相关 。 在 这 个 意义 上 上， 程序 语言 对 于 指令 
集 的 设计 有 相当 大 的 影响 。 

让 我 们 来 了 解 程序 语言 是 如 何 影 响 指令 集 设计 的 。 高 级 语言 中 诸如 赋值 语句 和 表达 式 这 样 
的 结构 会 映射 到 算术 / 逻辑 指令 和 加 载 /存储 指令 。 高 级 语言 支持 的 数据 抽象 需要 指令 集 提供 
不 同 精度 的 操作 数 以 及 寻 址 模式 。 条 件 语 句 和 循环 结构 需要 条 件 和 无 条 件 跳 转 指 令 。 更 进一步 
来 说 ， 高 级 语言 中 像 过 程 这 样 的 模块 化 结构 需要 从 处 理 占 体系 结构 中 获得 附加 的 抽象 支持 。 

应 用 对 于 指令 集 设计 也 有 着 重要 的 影响 。 例 如 ， 科 学 计算 和 工程 计算 在 早期 计算 中 占据 
主导 地 位 。 相 应 地 ，20 世纪 70 年 代 和 80 年 代 的 高 端 系统 在 指令 集 上 支持 浮 点 运算 。 当 前 某 
些 时 候 ， 手 机 和 其 他 航 入 式 系 统 的 计算 占 了 主导 地 位 ， 随 着 计算 融入 社会 的 各 个 层面 ， 毫 无 
疑问 这 个 趋势 将 持续 下 去 。 音 频 和 视频 这 样 的 流 媒体 应 用 在 手持 设备 上 变 得 很 平常 。 自 然 地 ， 
这 些 应 用 的 需求 例如， 单独 一 条 指令 对 许多 数据 进行 操作 ) 开始 影响 指令 集 的 设计 。 

在 硬件 上 直接 支持 一 个 具体 的 系统 软件 或 应 用 的 需求 并 非 总 是 可 行 或 划算 的 。 例 如 ， 在 
计算 机 发 展 的 早期 ， 低 端的 计算 机 通过 软件 库 使 用 指令 集中 可 用 的 整数 运算 来 实现 浮 点 运算 。 
直到 今天 ， 复 杂 的 操作 (例如 求 余 弦 ) 依然 不 应 该 由 通用 处 理 器 的 指令 集 直接 支持 。 替 代 的 方 
法 是 ， 一 些 专门 的 系统 软件 ( 称 为 数学 库 ) 通过 将 这 些 复杂 操作 映射 为 指令 集中 的 简单 指令 来 
实现 它们 。 

操作 系统 对 于 指令 集 的 设计 也 有 影响 。 一 个 处 理 髓 可 能 会 同时 运行 多 个 程序 。 想 想 你 的 
台式 机 或 掌上 电脑 ， 上 面 运 行 着 和 若干 个 程序 ， 但 是 却 没有 多 个 处 理 器 。 因 此 ， 在 我 们 切换 到 
男 一 个 程序 之 前 ， 需 要 记 住 一 个 程序 正在 做 什么 。 你 可 以 想象 一 个 动作 麻利 的 厨师 在 4 口 锅 
里 炒 4 个 不 同 的 菜 ， 她 记 住 了 每 道 菜 做 到 了 哪个 阶段 并 适时 加 入 调料 。 操 作 系 统 是 这 样 的 一 
个 软件 实体 ( 即 是 它 自身 的 一 个 程序 )， 它 像 厨师 处 理 不 同 的 菜 一 样 ， 安 排 不 同 的 程序 在 处 理 
器 上 执行 。 操 作 系 统 自身 也 对 处 理 器 设计 有 影响 ， 在 后 面 讨 论 程序 不 连续 性 和 内 存 管 理 的 音 
节 中 这 会 变 得 很 显而易见 。 


2.1 ”人 处理 器 设计 涉及 什么 

通过 四 辑 设计 课程 ， 我 们 掌握 了 寄存 器 、 算 术 / 逻辑 单元 这 样 的 硬件 资源 ， 还 有 将 它们 
连接 起 来 的 数据 通路 。 当 然 ， 还 有 用 来 存放 程序 和 数据 的 主 存 储 右 、 在 一 组 输入 源 中 进行 选 
择 的 多 路 选择 器 、 连 接 处 理 器 资源 和 主 存储 器 的 总 线 、 用 于 将 数据 从 数据 通路 放 到 总 线 上 的 
驱动 。 我 们 很 快 将 讨论 数据 通路 。 
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我 们 将 这 些 便 件 资 源 比 喻 为 英语 中 的 字母 表 。 单词 使 用 字母 表 构 成 英语 的 字典 。 类 似 地 ， 
处 理 需 的 指令 集 使 用 便 件 资源 来 构成 处 理 需 。 正如 目 然 语言 中 的 单词 让 我 们 能 够 表达 不 同 的 
思想 和 情感 一 样 ， 指 令 集 让 我 们 能 够 安排 处 理 右 中 的 人 硬件 资源 做 不 同 的 事情 。 因 此 ， 指 令 集 
是 区 分 Intel x86, PowerPC “Yb PEGE hy BE 

作为 计算 机 用 户 ， 我 们 知道 可 以 在 不 同 层次 对 计算 机 进行 编程 ， 在 C、Python 和 Java 的 
层次 ; 在 汇编 语言 的 层次 ; 直接 使 用 机 盘 语 言 的 层次 . 

各 令 集 就 是 计算 机 体系 结构 开 出 的 处 方 ， 指 定 了 这 个 计算 机 需要 的 能 力 ， 指 令 集 应 该 对 
机 器 语言 程序 员 可 见 。 因 此 ， 指 令 集 是 一 个 软件 ( 即 在 计算 机 任何 层级 上 运行 的 程序 ) 和 实 
际 硬件 实现 之 间 的 契约 。 指 令 集 的 实现 有 着 许多 选择 ， 我 们 将 在 后 面 的 草 节 中 讨论 这 些 选 择 。 
首先 ， 我 们 将 探索 指令 集 设计 的 固有 问题 。 


2.2 ”如 何 设计 指令 集 


计算 机 由 计算 的 机 咒 演 化 而 来 ， 在 早期 的 计算 机 设计 中 ， 指 令 集 的 选择 很 大 程度 上 由 硬 
件 能 否 实现 这 些 指令 来 决定 。 这 是 因为 当时 的 硬件 非常 昂贵 ， 而 程序 都 是 直接 用 汇编 语言 写 
成 的 。 因 此 ， 指 令 集 的 设计 很 大 范围 内 是 电子 工程 师 的 工作 ， 因 为 他 们 对 硬件 实现 的 可 行 性 
有 非常 好 的 想法 。 然 而 ， 硬 件 成 本 降低 了 ， 程序 设计 也 日 趋 成 熟 ， 高 级 语言 被 开发 出 来 ， 央 
此 问题 从 硬件 实现 的 可 行 性 转移 到 指令 是 否 实 际 有 用 上 来 ， 即 指令 是 否 有 利于 用 高 级 语 襄 
写 出 高 效 而 紧凑 的 程序 。 

事实 证 明 ， 指 令 集 负责 安排 处 理 器 内 部 做 什么 ， 而 计算 机 用 户 很 少 需要 直接 和 指令 集 打 
交道 。 毫 无 疑问 ， 当 你 在 玩 视 频 游 戏 的 时 候 ， 你 不 会 关心 处 理 需 正在 执行 什么 指令 。 用 汇编 
语言 写 程序 比 用 高 级 语言 写 程序 容易 出 错 是 共识 。 

从 人 工 手 写 汇编 语言 程序 到 编译 器 将 高 级 语言 程序 转换 为 机 需 代 码 的 变化 是 指令 集体 系 
结构 演化 的 主要 原因 。 这 个 变化 意味 着 我 们 将 寻求 一 个 简单 的 指令 集 使 高 级 语言 结构 能 够 转 
化 为 高 效 代码 。 

这 里 有 一 点 需要 注意 ， 指 令 集 的 优雅 是 非常 重要 的 ， 体 系 结构 领域 在 这 个 方向 上 做 了 大 
量 工作 。 然 而 ， 与 此 同等 重要 甚至 需要 首先 关注 的 是 指令 集 实现 的 效能 。 具 体 来 说 ,在 努力 
实现 更 简单 、 更 快 的 指令 集 的 时 候 ， 指 令 集体 系 结构 的 规律 性 是 一 个 非常 值得 考虑 的 因素 。 
我 们 在 第 3 章 和 第 5 章 讨论 实现 细节 的 时 候 还 会 再 提 到 这 一 点 - 

虽然 每 种 高 级 语言 都 有 其 独特 的 语法 和 语义 特性 ， 但 我 们 依然 可 以 找 出 一 组 在 大 部 分 高 
级 语言 中 都 存在 的 基本 功能 。 我 们 首先 要 做 的 就 是 找 出 这 样 一 组 功能 。 我 们 以 编译 这 样 的 功 
能 作为 讨论 和 开发 指令 集 的 基本 动机 。 正 如 我 们 在 本 章 开 头 提 到 的 那样 ， 除 了 编译 高 级 语言 
结构 之 外 ， 指 令 集 还 受到 许多 其 他 因素 的 影响 。 我 们 将 在 2.11 节 讨 论 这 些 因素 。 


2.3 常见 的 高 级 语言 功能 

考虑 如 下 功能 集 : 

1) 表达 式 和 赋值 语句 ”编译 这 样 的 结构 揭示 了 许多 指令 集体 系 结构 (Instruction-Set 
Architecture, ISA) 中 的 细微 之 处 ， 从 算术 / 逻辑 操作 的 种 类 到 一 个 指令 中 操作 数 占 的 大 小 和 位 置 。 

2 ) 高 级 数据 抽象 ”编译 一 个 简单 变量 的 聚合 (在 高 级 语言 中 常 称 为 结构 (structure) 或 记 
录 (record)) 揭示 出 更 多 ISA 需要 的 细 刷 。 

3 ) 条 件 语 句 和 循环 ”编译 这 些 结构 使 得 程序 的 顺序 执行 发 生变 化 ， 并 且 需 要 ISA 有 额外 


a,, 


的 机 制 。 

4 ) 过 程 调用 过程 让 我 们 能 够 开发 模块 化 日 便于 维护 的 代码 。 过 程 调用 和 返回 的 编译 给 
指令 集 的 设计 市 来 了 新 的 挑战 ， 包 括 记录 程序 执行 过 程 前 后 的 状态 、 给 过 程 传递 参数 、 接 收 
过 程 的 返回 值 。 

在 2.4 ~ 2.8 47, 我们 将 从 有 效 编译 这 些 功 能 的 角度 依次 考虑 每 个 功能 并 开发 出 ISA 所 需 
的 机 制 。 在 2.10 节 ， 我 们 通过 展示 LC-2200 ISA 来 总 结 前 面 的 讨论 。LC-2200 ISA 是 一 个 简 
单 的 指令 集 ， 将 作为 后 面 探索 处 理 器 实现 细节 的 基础 。 


2.4 表达 式 和 赋值 语 名 
我 们 知道 任何 高 级 语言 (例如 Java、C 和 Perl) 都 有 算术 /逻辑 表达 式 和 赋值 语句 : 


a=b +c; /xp 与 c 相 加 放 入 ax/ (1) 
d=e-—f; /* em#E HAA */ (2) 
x= y & z; /* y fz fanD, BARRA x*/ (3) 


上 面 的 每 条 语句 都 以 两 个 操作 数 为 输入 ， 执 行 一 次 操作 ， 然 后 将 结果 存 到 第 三 个 操作 数 中 。 
考虑 在 一 个 处 理 需 指令 集中 的 下 面 3 ATES: 


add a, b, c ae bte (4) 
sub id e, f+ d«ee-f (5) 
and x, Y, Z; x <—y&z (6) 


高 级 语言 结构 (1), (2), (3) 分 别 直接 映射 为 指令 (4), (5), (6). 

这 样 的 指令 称 为 双 操 作 数 (binary) 指令 ， 因 为 它们 都 利用 两 个 操作 数 进 行 工 作 来 产生 一 
个 结果 。 它 们 也 被 称 为 三 操作 数 (three-operand) 指令 ， 因 为 有 三 个 操作 数 (两 个 源 操作 数 和 
一 个 目的 操作 数 )。 是 不 是 每 个 双 操 作 数 指令 都 需要 三 个 操作 数 呢 ? 简单 地 说 ， 不 是 。 在 接 下 
来 的 小 节 中 我 们 将 详细 阐述 这 个 问题 的 答案 。 


2.4.1 操作 数 放 在 哪里 


让 我 们 讨论 一 下 上 面 提 到 的 等 式 中 的 变量 (abeadefxyz) 的 位 置 。 图 2-1 是 一 个 简单 的 
处 理 融 模型 。 

处 理 需 内 部 是 一 个 算术 /逻辑 单元 ， 或 者 叫做 ALU, CHAIT ADD, SUB, AND 和 OR 等 
运算 。 我 们 现在 讨论 这 些 指令 的 操作 数 放 在 什么 地 方 。 首先 以 一 个 比喻 来 开始 。 

假设 你 有 一 个 工具 箱 ， 里 面 有 很 多 工具 。 很 多 工具 箱 都 有 一 
个 工具 盘 ( tool-tray )。 如 果 你 在 做 某 件 事情 (比如 修理 厨房 的 水 
龙头 )， 将 螺丝 刀 和 水 管 扳 手 从 工具 箱 移 到 工具 盘 中 ， 然 后 将 工具 
盘 拿 到 厨房 水 权 处 。 接 着 你 会 进行 修理 ， 完 成 后 将 工具 盘 中 的 工 
具 放 回 工具 箱 中 。 显 然 ， 你 不 会 每 次 拿 工具 都 跑 到 工具 箱 去 拿 ， ees: 
而 是 希望 这 个 工具 已 经 在 工具 盘 里 面 了 。 换 名 话说， 你 通过 将 需 四 了! PERE 





要 的 最 少 工具 放 入 工具 盘 ， 优 化 了 跑 到 工具 箱 边 的 次 数 。 ee 
我 们 在 设计 指令 的 时 候 也 想 这 样 。 我 们 已 经 知道 术语 寄存 器 dome 
用 来 描述 处 理 器 中 可 用 的 资源 。 它 们 就 像 内 存 一 样 ， 但 是 在 处 理 FTES 


器 内 部 的 ， 所 以 在 物理 上 (因此 也 在 电子 上 ) 更 加 靠近 ALU， 被 制造 得 比 内 存 更 快 ， 如 图 2-2 
所 示 。 因 此 ， 如 果 指 令 的 操作 数 都 在 寄存 器 中 ,那么 取得 操作 数 就 会 比 操作 数 在 内 存 中 的 情 
况 要 快 得 多 。 但 这 还 不 是 故事 的 全 部 。 


(i AF FF ati AT n — “PS LACE AEA, Je FRE A A ZY Ach a UI, o 
我 们 将 这 个 问题 称 为 操作 数 的 可 寻 址 性 。 回 到 工具 箱 和 工具 盘 的 比喻 。 假 设 你 经 营 着 一 家 汽 
车 修理 店 ， 现 在 你 的 工具 箱 相 当 大 。 你 的 工作 需要 工具 箱 中 几 处 理 器 
乎 所 有 的 工具 ， 但 会 在 不 同时 候 用 到 -。 因此 ， 在 你 工作 的 不 同 阶 
段 ， 你 会 将 工具 盘 中 的 工具 送 回 工 具 箱 ， 将 下 一 阶段 需要 的 工具 
放 人 工具 盘 中 。 显 然 ， 每 个 工具 在 工具 箱 中 都 有 唯一 的 位 置 ， 但 
在 工具 盘 中 却 没有 。 实 际 上 你 重复 使 用 工具 盘 上 的 空间 来 放 工具 
箱 中 的 不 同 工 具 . 

一 个 对 操作 数 进 行 唯一 寻 址 的 体系 结构 将 面临 同样 的 困境 。 
现代 处 理 右 有 着 非常 大 的 存储 系统 。 随 着 内 存 容量 的 增加 ， 内 存 


图 2-2 ”在 处 理 器 内 部 加 入 
寄存 器。 寄存 器 与 


peers 5 , ALU 的 近 距 离 减 
地 址 的 大 小 ( 即 用 来 表示 内 存 中 唯一 地 址 的 位 数 ) 也 相应 增加 。 少 了 ALU 取得 操 
__ BIB A SE BH A hy FFE C4 RFEA ty ‘ 
因此 ， 如 果 一 条 指令 需要 三 个 内 存 操 作 数 ， 那 么 每 条 指令 的 大 省 作 数 所 需 的 时 间 


都 会 增加 。 操 作 数 的 可 寻 址 性 是 个 大 问题 ， 每 条 指令 都 需要 占据 
好 几 个 内 存单 元 以 满足 对 所 有 内 存 操作 数 的 唯一 命名 。 

另 一 方面 ， 有 了 少数 寄存 器 配合 当前 程序 所 需 (就 像 工具 盘 )， 我 们 就 可 以 解决 内 存 可 寻 
址 性 问题 ， 因 为 用 来 表示 唯一 寄存 器 地 址 所 需 的 位 数 很 少 。 作 为 内 存 可 寻 址 性 问题 的 推论 ， 
寄存 器 数量 必须 较 小 以 限制 用 来 寻 址 寄存 器 所 需 的 位 数 (即便 是 芯片 集成 技术 允许 体系 结构 
中 包含 更 多 的 寄存 带 ). 

所 以 ， 我们 的 指令 看 起 来 是 这 样 的 : 


add rl, r2, r3; rl < r2 + r3 
sub r4, r5, r6; r4 < r5 — r6 
and x7; £8; E9: FEV < E8 & T9 


另外 ,程序 常 需要 使 用 常量 。 例 如 ， 将 寄存 器 初始 化 为 某 个 值 是 某 个 例 程 的 要 求 。 满 足 这 
个 要 求 的 最 简单 方法 就 是 指令 自身 的 某 一 部 分 作为 常量 。 这 样 的 常量 值 称 为 立即 值 。 

例如 ， 我 们 有 一 条 这 样 的 指令 : 

addi rl, r2, imm; rl < r2 + imm 

在 这 条 指令 中 ， 作 为 指令 一 部 分 的 立即 值 成 了 第 三 个 操作 数 。 在 编译 高 级 语言 时 立即 什 
非常 方便 。 


给 出 下 面 的 指令 : 


ADD Rx, Ry, RZ k Rx + Ry + RZ 
ADDI Rx, Ry, Imm ; Rx +-Ry + 立即 值 
NAND Rx, Ry, RZ ; Rx + NOT(Ry AND RZ) 
如 何 达 到 下 面 这 条 指令 的 效果 ? 
SUB Rx, Ry, RZ > Rx 《一 Ry = RZ 
5: 
NAND Rz, Rz, Rz ; 将 Rz 变 为 Rz 的 反 码 
ADDI Rz, Rz, 1 ; 将 Rz 变 为 Rz 的 补 码 
现在 Rz 其 实 包 含 了 -Rz 
ADD Rx, Ry, RZ : Rx 一 Ry + (-Rz) 


后 面 两 条 指令 恢复 了 Rz 的 原始 值 
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NAND Rz, Rz, Rz ; 将 Rz 变 为 Rz 的 反 码 
ADDI Rz, Rz, 1 ; 将 Rz 变 为 Rz 的 补 码 


对 于 这 些 算术 /逻辑 运算 来 说 ， 所 有 的 操作 数 都 在 寄存 器 中 。 我 们 引入 寻 址 模式 的 概念 ， 
寻 址 模式 指 的 是 在 一 条 指令 中 如 何 指定 某 个 操作 数 。 这 里 使 用 的 寻 址 模式 ， 所 有 的 操作 数 都 
在 寄存 器 中 ， 因 此 被 称 为 寄存 器 寻 址 。 

关于 高 级 结构 (1)、(2)、(3 )， 现 在 探索 程序 变量 ab，c，d，e,，f,，x，y，z 和 这 些 
处 理 希 寄存 融 的 关系 。 首 先 ， 假 设 这 些 变量 都 在 内 存 中 ， 由 编译 需 放 在 众所周知 的 地 方 。 因 
为 变量 在 内 存 中 但 算术 /逻辑 运算 指令 只 能 使 用 寄存 器 ， 因 此 必须 将 变量 从 内 存 搬 到 寄存 器 
中 。 所 以 ， 我 们 需要 另外 一 些 指令 来 将 数据 在 内 存 和 寄存 需 之 间 来 回 搬运 。 这 些 指令 称 为 加 
R (从 内 存 加 载 到 寄存 器 ) 和 存储 (从 寄存 器 存储 回 内 存 ) 指令 。 

例如 ， 

ld #2; b; r2 €e P 
st rl, aj a < rl 
有 了 加 载 /存储 指令 和 算术 / 逻辑 指令 ， 现 在 可 以 将 这 样 的 一 个 结构 


a=bete 


“编译 ”为 

ld #2, Ð (7) 

ld 3; & (8) 

add rl, r2, B3 (9) 

St Fl, & (10) 

也 许 有 人 感到 奇怪 ， 为 什么 不 单纯 使 用 内 存 操作 数 来 避免 寄存 器 的 使 用 呢 ? 毕竟 ， 这 一 
条 单独 的 指令 

add a, b, c 


与 (7) ~ (10) 所 示 的 4 条 指令 序列 相 比 是 如 此 优雅 而 有 效 。 

借助 于 工具 箱 比 喻 可 以 很 好 地 理解 其 中 的 原因 。 你 知道 自己 在 工作 中 要 多 次 使 用 螺丝 刀 ， 
因此 ， 并 不 是 每 次 都 到 工具 箱 中 取 螺 丝 刀 ， 而 是 花费 一 些 代 价 将 其 移 至 工具 盘 中 ， 然 后 多 次 
重用 它 ， 直 到 将 它 放 回 工具 箱 为 止 。 

内 存 就 像 工 具 箱 ， 而 寄存 需 就 像 是 工具 盘 。 你 预计 程序 中 的 变量 将 会 在 多 个 表达 式 中 使 
用 。 考 虑 如 下 的 高 级 语言 语句 : 

oo 

可 以 看 到 ， 一 旦 a，b，c 从 内 存 被 带 到 寄存 器 中 ， 仅 仅 在 这 一 个 表达 式 求 值 中 就 重用 了 知 
干 次 。 试 着 将 这 个 表达 式 “ 编 译 ” 为 指令 序列 (假设 乘法 指令 有 着 和 加 法 指令 相似 的 形式 )。 变 
量 在 寄存 器 中 的 重用 给 我 们 带 来 了 什么 呢 ? 答案 是 速 
度 。 正 如 本 节 中 已 经 说 明 的 那样 ， 因 为 寄存 句 在 处 理 
器 内 部 ， 因 此 我 们 访问 程序 变量 的 时 间 与 每 次 都 到 内 
存 中 访问 相 比 缩短 了 很 多 。 

在 一 条 加 载 指令 中 ， 其 中 一 个 操作 数 是 一 个 内 存 
地 址 ， 另 一 个 操作 数 是 这 条 加 载 指令 的 目的 寄存 器 
( 见 图 2-3 )。 同 样 ， 在 一 条 存储 指令 中 ， 目 标 是 一 个 “图 2-3 从 内 存 中 装载 寄存 带 。 处 理 带 

[25] 内 存 地 址 。 在 装载 指令 中 指明 了 源 内 存 地 
址 和 目标 寄存 器 地 址 
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ware 一 种 体系 结构 有 一 个 称 为 累加 器 (ACC) 的 寄存 器 ， 以 及 操作 内 存 的 指令 ，ACC 如 下 ， 


LD ACC, a ; Acc + 内 存 地 址 a 的 内 容 
St a, Ace ; 内 存 地 址 a 的 内 容 — acc 
ADD ACC, a ; ACC + ACC + 内 存 地 址 a 的 内 容 


使 用 上 面 的 指令 ， 该 如 何 实 现下 面 指令 的 语义 ? 

ADD a,b,c; 内 存 地 址 a 的 内 容 — 内 存 地 址 b 的 内 容 + Nac 的 内 容 
答 : 

LD ACC, b 

ADD ACC, c 

ST a, ACC 


2.4.2 在 指令 中 如 何 指定 内 存 地 址 


我 们 考虑 如 何 使 用 指令 的 一 部 分 来 指定 内 存 地 址 。 当 然 ， 可 以 将 地 址 直接 嵌入 指令 中 。 
但 是 这 个 途径 有 一 个 问题 。 在 2.4.1 节 中 提 到 ， 用 来 表示 一 个 内 存 地 址 的 位 数 已 经 很 多 了 ， 并 
且 随 着 内 存 容量 的 增 大 ， 情 况 只 会 变 得 更 糟 。 例如， 如 果 我 们 有 一 个 PB 级 (KY 2° 字 节 ) 
的 内 存 ， 则 在 指令 中 需要 50 位 来 表示 一 个 内 存 操作 数 。 进 一 步 ， 正 如 将 在 2.5 节 中 所 见 的 那 
EE. 编译 高 级 语言 (尤其 是 面向 对 象 的 语言 ) 写 的 程序 时 ， 编 译 器 只 知道 复杂 数据 结构 (如 数 
组 或 对 象 ) 的 每 个 成 员 的 偏 移 量 (相对 于 这 个 结构 的 地 址 )。 所 以 我们 引入 一 种 寻 址 模式 来 
缓解 每 条 指令 都 需要 将 整个 内 存 地 址 操作 数 放 入 其 中 的 情况 。 

这 样 的 寻 址 模式 称 为 基 址 加 偏 移 量 ( base+offset) 模式 。 在 这 种 寻 址 模式 中 ， 指 令 中 的 内 
存 地 址 为 一 个 寄存 器 ( 基 址 寄存 器 ) 的 内 容 与 一 个 偏 移 量 (以 立即 值 形式 包含 于 指令 中 ) 的 
和 。 通 常 表示 为 

ld r2, offset(rb); r2 < MEMORY[rb + offset] 

如 果 rb 包含 变量 b 的 内 存 地 址 ， 而 偏 移 量 为 0， 则 上 面 的 指令 等 价 于 将 程序 变量 b 加 载 
到 寄存 器 r2 中 。 

注意 ,rb 可 以 是 处 理 器 中 的 任意 一 个 寄存 器 。 

如 前 所 述 ， 基 址 加 偏 移 量 寻 址 模式 的 威力 在 于 它 可 以 用 来 加 载 和 存储 简单 的 变量 ,很 快 
我 们 将 会 看 到 ， 它 还 可 以 用 于 复合 变量 (比如 数组 和 结构 ) 的 元 素 。 


给 出 下 列 指令 : | 
LW Rx, Ry, OFFSET ; Rx 二 MEM[Ry + OFFSET] 


ADD Rx, Ry, RZ ; Rx + Ry + RZ 
ADDI Rx, Ry, Imm ; Rx + Ry + 立即 值 

现在 要 完成 一 种 新 的 寻 址 模式 ， 称 为 自动 递增 寻 址 用 于 具有 下 列 语义 的 加 载 指令 : 
LW Rx, (Ry)+ ; Rx « MEM[Ry] ; 


Ry + Ry + 1; 
请 给 出 一 个 解答 ， 用 给 出 的 指令 来 实现 上 述 LW 指令 。 
ae 


A ie 
LW Rx, Ry, 0 ; Rx + MEM[Ry + 0] 
ADDI Ry, Ry, 1 ; Ry + Ry + 1 


26 | 


27 | 


28 | 
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2.4.3 每 个 操作 数 应 该 有 多 宽 


操作 数 的 宽度 与 其 粒度 或 者 说 精度 有 关 。 为 了 回答 这 个 问题 ， 我 们 需要 回顾 高 级 语言 
其 支持 的 数据 类 型 。 我 们 用 C 语言 作为 一 种 典型 的 高 级 语言 代表 。C 语言 中 的 基本 数据 类 型 
有 short、int、long、char。 这 些 数据 类 型 的 宽度 与 实现 相关 ， 一般 来 说 ，short 是 16 fiz, int 
是 32 i, char 是 8 位。 我 们 知道 char 数据 类 型 在 C 中 用 来 表示 字母 数字 字符 。char 类 型 宽 
8 位 的 背后 有 着 历史 原因 。 为 了 在 计算 机 和 通信 设备 之 间 交 换 信 息 ， 人 们 使 用 ASCII 码 作为 
字母 数字 字符 (打字 机 上 能 找到 的 那些 符号 ) 数字 编码 的 标准 。ASCII 码 使 用 7 位 来 表示 一 个 
字符 。 也 许 有 人 觉得 char 数据 类 型 应 该 是 7 位 宽 。 然 而， 在 C 语言 诞生 的 年 代 ， 流 行 的 指令 
集 都 使 用 8 位 宽 的 操作 数 ， 所 以 对 于 C 语言 来 说 ， 使 用 8 位 的 char 类 型 非常 方便 。 类 似 地 ， 
int 数据 类 型 为 32 位 宽 的 原因 是 32 位 的 处 理 器 体系 结构 十 分 常见 。 

下 一 个 问题 是 选择 每 个 操作 数 的 粒度 。 这 依赖 于 数据 类 型 所 需 的 精度 。 我 们 先 给 出 数据 
精度 的 非 正 式 定义 。 假 设 你 在 程序 中 需要 一 个 变量 x 来 存储 取 值 范围 在 0 ~ 255 的 无 符号 整 
数 ， 那 么 仅 需 要 8 位 来 表示 这 样 一 个 变量 。 因 此 ，x 所 需 的 精度 是 8 位 。 类 似 地 ， 如 果 在 你 
的 程序 中 有 一 个 有 符号 整数 y 取 值 范围 在 -2"” ~ 2°'-1, 那么 需要 32 位 精度 来 表示 这 样 一 个 
变量 (假设 使 用 补 码 表示 )。 高 级 语言 中 的 数据 类 型 (如 C 中 的 int, short, char) 给 程序 员 提 
供 了 为 不 同 需 求 的 变量 定制 不 同 数 据 精 度 的 灵活 性 。 你 可 能 惊讶 于 为 什么 会 提供 这 样 的 定制 
而 不 是 简单 地 采取 体系 结构 所 支持 的 最 高 精度 ， 答 案 是 ， 这 是 一 个 在 时 间 和 空间 上 进行 优化 
的 机 会 。 程 序 变量 的 精度 越 低 ， 在 内 存 中 占用 的 空间 就 越 小 。 此 外 ， 对 于 精度 需求 较 低 的 算 
术 /逻辑 运算 来 说 ， 在 处 理 器 和 内 存 之 间 来 回 运 送 操 作 数 也 会 有 一 定 的 时 间 优 执 ， 对 于 浮 点 
算术 运算 来 说 尤为 如 此 。 所 以 , 为 了 空间 和 时 间 上 的 优化 ， 最 好 是 指令 中 操作 数 的 精度 恰好 
满足 数据 类 型 的 需求 。 这 也 解释 了 为 什么 处 理 需 在 指令 集 上 文 持 多 种 精度 ， 即 字 、 半 字 和 和 衬 
节 。 字 精度 通常 指 的 是 体系 结构 在 人 硬件 上 对 算术 /逻辑 运算 文 持 的 最 高 精度 。 其 他 的 精度 类 
别 允 许 在 时 间 和 空间 上 进行 优化 。 

为 了 方便 讨论 ， 我 们 约定 一 个 字 是 32 位 ， 半 字 是 16 位 ， 字 节 是 8 位。 这 些 精 度 类 别 正 
好 对 应 于 大 部 分 C 语言 实现 中 的 int, short 和 char 类 型 。 这 样 的 选择 是 基于 2009 年 前 后 大 部 
分 的 硬件 字 长 都 是 32 位 。 在 2.4.1 节 中 ， 我 们 已 经 介绍 了 操作 数 可 寻 址 性 的 问题 。 当 体系 结 
构 支 持 多 种 精度 后 ， 就 出 现 一 个 内 存 操作 数 的 可 寻 址 性 问题 。 这 里 的 可 寻 址 性 指 的 是 能 够 在 
内 存 中 单独 指定 的 最 低 精 度 的 操作 数 。 比 如 ， 如 果 一 台 机 需 是 字 节 可 寻 址 的 ， 那 么 能 够 单独 
寻 址 的 最 低 精 度 就 是 字 节 。 如 果 是 字 可 寻 址 的 ,那么 能 够 单独 寻 址 的 最 低 精 度 就 是 字 。 我 们 
约定 讨论 中 是 字 节 可 寻 址 的 。 

因此 ， 一 个 字 在 内 存 中 看 起 来 是 这 样 的 : 


vej | fuse 


每 个 字 里 面 有 4 个 字 节 。(MSB 指 最 高 有 效 字 节 (most significant byte); LSB 指 最 低 有 效 
字 节 (least significant byte))。 例 如 ， 我 们 在 程序 中 有 一 个 整数 变量 为 


0=x11223344 


那么 它 在 内 存 中 看 起 来 是 这 样 的 : 








加 回回 加 


AL EB de KR PEH 19 


每 一 个 字 节 都 能 够 单独 被 寻 址 ， 想 必 体 系 结构 上 会 有 在 这 个 级 别 的 精度 上 进行 操作 的 指令 。 
那么 ， 指 令 集中 应 该 包含 操作 不 同 精度 操作 数 的 指令 ， 如 下 所 示 ; 


ld rl, offset(rb); 从 地 址 rb+offset 处 装 入 一 个 FF rl 中 

ldb rl, offset(rb); 从 地 址 rb+offset 处 装 入 一 个 字 节 到 ri 中 

add x1, r2, x3: 将 寄存 器 r2 和 工 3 中 的 字 操 作 数 相 加 并 将 结果 置 于 r1 中 
addb rl, r2, r3; 将 寄存 器 r2 和 工 3 中 的 字 节操 作 数 相 加 并 将 结果 置 于 r1 中 


文 持 多 种 精度 的 操作 数 的 体系 结构 决策 和 处 理 器 的 硬件 实现 之 间 是 有 关系 的 。 硬 件 实现 
包括 确定 数据 通路 的 宽度 以 及 数据 通路 中 各 种 硬件 资源 (如 寄存 器 ) 的 宽度 。 我 们 将 在 第 3 章 
和 第 5 章 讨 论处 理 需 实现 的 更 多 细节 。 因 为 在 讨论 中 我 们 认为 一 个 字 (32 位 ) 是 硬件 支持 的 
最 大 精度 ， 为 了 方便 ， 假 设 数据 通路 是 32 位 宽 。 也 就 是 说 ， 所 有 的 算术 / 逻辑 运算 的 操作 数 
都 是 32 位 的 。 相 应 地 ， 假 设 寄存 器 的 宽度 是 32 位 以 恰好 满足 数据 通路 的 宽度 。 需 要 注意 的 
是 ， 寄 存 赫 和 数据 通路 的 宽度 正好 与 体系 结构 选择 的 数据 宽度 相同 并 不 是 必需 的 ， 但 确实 是 
方便 且 有 效 的 。 与 此 同时 ,体系 结构 和 人 硬件 实现 也 需要 为 操作 较 低 精度 操作 数 的 指令 提供 一 
些 便利 。 例 如 ， 像 addb 这 样 的 指令 是 8 位 精度 的 ， 它 使 用 源 寄 存 需 中 的 低 8 位 进行 加 运算 ， 
然后 将 结果 置 于 目标 寄存 需 的 低 8 位 中 。 

值得 注意 的 是 ， 现 代 的 体系 结构 已 经 升级 为 64 位 整数 运算 。 甚 至 连 C 语言 都 引入 了 64 
位 精度 的 数据 类 型 ， 但 这 些 数 据 类 型 的 名 字 在 不 同 的 编译 需 中 可 能 有 些 不 一 致 。 然 而 ， 本 曹 
中 我 们 对 指令 集 设计 进行 的 概念 上 的 讨论 ， 与 实际 硬件 支持 的 精度 是 完全 正 交 的 。 


2.4.4 FPF 


字 节 可 寻 址 的 机 器 中 存在 着 一 个 有 趣 的 问题 ， 就 是 一 个 字 中 各 个 字 节 排列 的 顺序 。 在 字 
节 可 寻 址 的 机 器 中 ， 一 个 4 字 节 的 字 ， 如 果 从 地 址 100 开始 ， 那 么 这 个 字 其 实 占据 了 内 存 中 


100、101、102、103 这 4 个 连续 字 记 。 
回回 加 


101 102 103 


这 4 个 字 节 组 合 起 来 就 成 了 地 址 100 处 的 一 


100 | 包含 4 个 字 节 的 一 个 字 


假设 100 处 的 这 个 字 的 值 为 0x11223344， 那么 这 4 个 字 节 在 字 中 有 两 种 可 外 EB 的 组 织 方式 : 


组 织 方式 1: 
CHap 


101 102 103 


在 这 种 组 织 方式 中 ， et ee et et 
为 大 端 模式 。 
组 织 方式 2: 





| || 


103 102 101 100 
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在 这 种 组 织 方 式 中 ， 该 字 的 LSB (EE 44,..) 位 于 字 的 地 址 即 100 上 ， 这 种 组 织 方式 称 
为 小 端 模式 。 

由 此 可 见 ， 字 节 序 是 根据 哪个 字 节 处 于 字 的 地 址 上 来 区 分 的 。 如 果 是 MSB ， 就 是 大 端 ; 
如 果 是 LSB ， 就 是 小 端 。 

原则 上 ， 对 于 使 用 高 级 语言 编程 来 说 ， 字 节 序 其 实 是 无 所 谓 的 ， 前 提 是 严格 按照 所 声明 
的 数据 类 型 要 求 的 那样 去 使 用 程序 中 的 变量 . 

然而 ,在 C 这 样 的 语言 中 ， 数 据 类 型 的 使 用 可 能 与 其 声明 的 不 同 。 

考虑 如 下 的 代码 片段 : 

int i = 0x11223344; 


char *c; 


c = (char *) &1i; 
printf("endian: i = x; c = %x\n", i, *c); 


我 们 来 研究 一 下 打印 出 来 的 ec WIA IEITA. OPO RS. LEP A YL 
器 上 ， 结 果 将 是 11.. ; 而 在 小 端的 机 器 上 ， 结 果 则 是 44,..。 这 个 故事 告诉 我 们 ， 如 果 你 声 
明了 某 种 精度 的 数据 类 型 却 用 别 的 精度 去 访问 它 ， 因 为 字 节 序 的 问题 ， 这 可 能 会 成 为 灾难 的 
根源 。 一 些 体系 结构 如 IBM PowerPC 和 Sun SPARC 是 大 端的 ， 而 Intel x86, MIPS 和 DEC 
Alpha 则 是 小 端的 例子 。 一 般 说 来 ， 字 节 序 对 于 程序 的 性 能 是 没有 影响 的 ， 但 总 能 找到 一 些 
病态 的 例子 使 得 某 一 种 字 节 序 比 另 一 种 具有 更 好 的 性 能 ， 这 些 例子 通常 为 字符 串 操 作 . 

比如 说 ， 考 虑 字符 串 “RAMACHANDRAN” 和 “WAMACHANDRAN ”在 大 端 机 器 中 
的 内 存 布局 (如 图 2-4 所 示 )。 假 设 前 一 个 字符 串 的 起 始 地 址 为 100。 


char a[13] = "RAMACHANDRAN"; 
char b[13] = “WAMACHANDRAN"; 


现在 来 考虑 一 下 相同 的 字符 串 在 小 端 机 器 中 的 内 存 布 局 ， 如 图 2-5 所 示 。 仔 细 观 察 图 2-4 
和 图 2-5 可 以 发 现 ， 在 大 端 机 器 中 ， 字 符 串 从 左 往 右 排 布 ; 而 在 小 端 机 需 中 则 从 右 往 左 排 布 。 
为 了 比较 这 两 个 字符 串 ， 在 两 种 体系 结构 中 ， 程 序 员 都 可 以 利用 字符 串 在 内 存 中 的 布局 来 获 
得 一 些 性 能 上 的 提高 。 





图 2-4 大 端 布 局 , 字 的 MSB 处 于 字 地 址 图 2-5 小 端 布局 。 字 的 LSB Ab FF H ht 
E (BIFE R 在 内 存 地 址 100 上 ) E (BIFE R 在 内 存 地 址 100 E) 


正如 前 面 提 到 的 ， 如 果 按 照 声 明 的 那样 去 操作 数据 类 型 ， 那 么 字 节 序 对 于 你 的 程序 是 至 
无 影响 的 。 然 而 ， 总 有 这 样 的 情况 ， 即 使 一 个 程序 并 没有 违反 上 面 的 规则 ， 字 他 订 依 然 会 影 
响 程序 行为 。 最 常见 的 情况 是 网 络 有 关 的 代码 ， 因 为 它 需要 在 多 种 不 同 的 机 器 上 工作 。 如 林 
发 送 端 是 小 端 机 器 而 接收 端 是 大 端 机 器 ， 其 至 连 网 络 代码 的 正确 性 都 会 受到 影响 。 正 是 由 于 


这 个 原因 ， 网 络 代码 中 使 用 格式 转换 例 程 在 网 络 格 式 和 本 机 格式 之 间 进 行 来 回转 换 ， 以 避免 
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淡 者 可 能 会 感到 奇怪 ， 为 什么 计算 机 的 制造 者 不 都 选择 同一 种 字 节 序 呢 ? 问题 在 于 ， 对 
不 同 的 计算 机 制造 者 来 说 ， 字 节 序 都 是 神圣 的 ， 而 且 目 前 也 没有 有 关 的 标准 ， 因 此 程序 员 只 
能 适应 多 种 不 同 字 节 序 处 理 器 共存 的 现实 。 

为 了 方便 讨论 ， 在 本 章 接 下 来 的 部 分 我 们 都 采用 小 端 体系 结构 。 


2.4.5 操作 数 打包 以 及 字 操 作 数 的 对 齐 


现代 的 计算 机 系统 有 大 量 的 内 存 。 因 为 有 大 量 的 内 存 可 以 使 用 ， 所 以 对 内 存 的 使 用 没有 
必要 音 青 。 然 而 ， 这 并 不 完全 正确 。 随 着 内 存 容量 的 增加 ， 软 件 对 内 存 的 胃口 也 更 大 了 。 程 |?! 
序 在 内 存 中 占据 的 空间 通常 被 称 为 内 存 印 迹 。 如 果 编 译 器 在 编译 时 非常 简单 粗暴 ， 可 能 会 尝 | 32 
试 将 程序 在 内 存 中 的 操作 数 打包 以 节约 空间 。 具 体 来 说 ， 如 果 数 据 结构 中 包含 了 多 种 不 同 粒 
度 的 变量 ( 即 int、char 等 ) 且 体 系 结构 支持 多 种 精度 的 操作 数 ， 那 么 这 是 很 有 意义 的 。 顾 名 
思 义 ， 打 和 包 的 意思 是 将 操作 数 排 布 在 内 存 中 时 保证 没有 空间 被 浪费 。 然 而 ， 在 本 章 中 我 们 将 
解释 为 何 打包 并 非 总 是 正确 的 途径 。 

首先 ， 我 们 讨论 编译 器 如 何 排 布 内 存 中 的 操作 数 以 达到 节约 空间 的 目的 。 考 虑 下 面 的 数 
据 结构 。 


struct { 
char a; 
char b{3]; 
} 


这 个 数据 结构 在 内 存 中 的 一 种 可 能 布局 以 100 为 起 始 地 址 ， 如 下 图 所 示 


+3 +2 +1 +0 


让 我 们 来 确定 这 个 数据 结构 最 终 需要 占据 的 内 存 大 小 。 因 为 每 个 char 是 1, LAB 
据 结构 的 实际 大 小 是 4 字 节 ， 但 上 面 的 布局 却 浪费 了 50% FA FEY ZS IB). BA ab oP et ER 
费 的 空间 。 这 就 是 未 打包 的 布局 。 
有 效 的 编译 器 将 释放 掉 浪 费 的 空间 而 将 上 面 的 数据 结构 打包 ， 以 100 为 起 始 地 址 ， 如 下 


图 所 示 : 
mafana] 。 | 


103 102 101 100 


编译 器 进行 的 打包 与 数据 类 型 要 求 的 精度 和 体系 结构 支持 的 可 寻 址 性 都 是 对 应 的 。 除 了 
节省 空间 以 外 ， 这 样 的 布局 还 能 减少 在 处 理 器 寄存 器 和 内 存 之 间 来 回 搬运 该 数据 结构 (包含 
变量 a 和 b) 所 需 的 访 存 次 数 。 因 此 ， 打 包 操 作 数 在 空间 和 时 间 上 都 是 高 效 的 。 

正如 我 们 上 面 提 到 的 ， 对 于 编译 器 来 说 ,打包 并 非 总 是 应 当 采 取 的 策略 。 E33 


CO meee hit Unix 源码 、 找 一 找 例 程 hton 和 ntoh， 即 host 到 network 以 及 network 到 host 的 格式 转 
换 例 程 。 


22 g 


bho 
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考虑 下 面 的 数据 结构 : 
struct { 
char a; 
int b; 
} . 
我 们 来 再 次 确定 这 个 数据 结构 需要 在 内 存 中 占据 多 少 空间 。 一 个 char 是 1 字 节 ， 一 个 int 
是 1 个 字 ( 即 4 字 节 )。 因 此 ， 总 共 需 要 5 字 节 来 存储 这 个 结构 。 我 们 来 看 看 其 中 一 种 可 能 的 
布局 ， 以 100 为 起 始 地 址 。 


+3 +2 Hi +0 


这 种 布局 的 问题 在 于 ，b 是 一 个 int， 它 始 于 地 址 101, 结束 于 104。 为 了 加 载 b， 需 要 从 
内 存 中 读 取 两 个 字 (分 别 从 100 和 104 两 个 地 址 读 取 )。 无 论 由 硬件 还 是 软件 来 实现 ， 这 都 是 
韭 常 低 效 的 。 体 系 结构 通常 要 求 字 操作 数 从 字 地 址 开始 ， 这 就 是 所 谓 的 操作 数 与 操作 地 址 的 
对 齐 限 制 。 

如 果 address 不 在 字 边 界 ( 100、104 等 ) 上 的 话 ， 那 么 下 面 的 指令 

ld r2, address 
就 是 一 条 非法 指令 。 尽 管 编译 需 可 以 生成 代码 来 加 载 两 个 字 (在 地 址 100, 104 处 ) 并 将 它们 
在 处 理 顺 中 重新 组 成 所 需 的 int 数据 类 型 ， 但 这 在 时 间 上 是 非常 低 效 的 。 因 此 ， 和 典型 的 编译 天 
在 布局 数据 结构 时 会 使 得 需要 字 精 度 的 操作 数位 于 字 边 界 地 址 。 

所 以 ， 编 译 需 很 可 能 将 上 面 的 数据 结构 按 下 图 的 方式 来 布局 ， 起 始 地 址 为 100: 
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尽管 这 个 布局 浪费 了 37.5% 的 空间 ， 但 从 访问 操作 数 的 时 间 这 个 角度 来 看 ， 变 得 更 加 高 
效 了 。 

你 将 会 看 到 ， 计 算 机 科学 领域 在 第 1 章 列 出 的 所 有 抽象 层次 (从 应 用 程序 到 体系 结构 ) 上 
都 会 表现 出 这 种 经 典 的 时 间 — 空间 的 权衡 。 


2.5 ”高 级 数据 抽象 


截至 目前 ， 我 们 已 经 讨论 了 高 级 语言 中 的 简单 变量 ,例如 char, int 和 float。 我 们 将 这 
些 变量 称 为 标量 。 这 些 变量 需要 的 存储 空间 都 是 先 验 的 。 编 译 器 可 选择 将 标量 变量 放 在 寄 
存 器 或 者 内 存 中 。 然 而 ， 对 于 高 级 语言 通常 支持 的 数据 抽象 ， 如 数组 和 结构 ， 编 译 项 只 能 
把 它们 分 配 在 内 存 中 ， 除 此 之 外 别 无 选择 。 回 想 一 下 ， 由 于 可 寻 址 性 的 问题 ， 处 理 带 中 寄 
存 器 的 数量 通常 只 有 十 来 个 。 所 以 ， 这 些 数据 结构 庞大 的 体积 排除 了 将 它们 分 配 在 寄存 带 
中 的 可 能 。 
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2.5.1 结构 


高 级 语言 中 的 结构 数据 类 型 可 以 通过 基 址 加 偏 移 量 的 寻 址 模式 来 提供 支持 。 
考虑 如 下 C 语 言 结 构 : 
struct { 

int a; 

char cC} 

int ds 

long e; 


} 

如 果 这 个 结构 的 基地 址 在 某 个 寄存 需 mb 中 ,那么 访问 结构 中 的 任意 字段 都 可 以 通过 提供 
一 个 相对 于 基 址 寄存 融 的 偶 移 量 来 守成。 编译 器 知道 每 个 数据 类 型 需要 多 少 空间 ， 也 知道 每 
个 变量 在 内 存 中 的 对 齐 情况 。 


2.5.2 ”数组 


int a[1000]; 从 a[0] 到 a[999] 的 一 个 整 型 数组 

这 里 的 a 所 指 的 并 非 是 单个 变量 ， 而 是 变量 a[0],a[1] 等 组 成 的 一 个 数组 。 由 于 这 个 原因 ， 
数组 也 第 被 称 为 同 量 。 这 种 变量 需求 的 空间 在 编译 的 时 候 可 能 知道 也 可 能 不 知道 ， 这 取决 于 
高 级 语言 的 语义 。 许 多 编程 语言 允许 数组 在 运行 时 动态 地 决定 大 小 而 不 是 在 编译 的 时 候 确定 。 
这 意味 着 ， 在 编译 期 间 编译 硕 不 知道 数组 所 需要 的 存储 空间 。 与 之 相反 的 是 ， 标 量 在 编译 时 
是 知道 所 需 空 间 大 小 的 。 因 此 ， 编 译 硕 通 第 会 使 用 内 存 来 为 这 些 回 量变 量 分 配 空间 。 

编译 上 希 可 能 会 将 变量 a 在 内 存 中 按 下 图 排 布 : 
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考虑 下 面 这 条 操作 数组 的 语句 : 

a[7] = a[7] + 1; 

为 了 编译 前 面 这 条 语句 ， 假 设 指令 集 只 允许 ALU 使 用 寄存 器 ， 那 么 首先 我 们 需要 将 a[7] 
从 内 存 中 取出 。 显 然 这 是 可 行 的 ， 使 用 我 们 已 经 介绍 过 的 基 址 加 偏 移 量 寻 址 模式 : 

la ri; 28(0rb) 

rb 初始 化 为 100 时 ， 上 面 这 条 指令 就 完成 了 将 a[7] 加 载 到 rl 中 的 工作 。 

一 般 来 说 ， 数 组 常 在 循环 中 使 用 。 在 这 种 情况 下 ， 可 能 有 个 循环 计数 硕 〈 设 为 j)， 它 被 用 
来 索引 数组 。 考 虑 下 面 的 指令 : 


35] 
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ALJ) = ajj] + 2y 

E EER, HX TAE AF ERE AY m et EAS AT EY. E EA 4 TS MESE. 
尽管 还 可 以 生成 代码 来 加 载 a[j] ， 在 能 够 计算 出 a[7] 的 有 效 地 址 之 前 还 需要 额外 的 指令 。 所 
以 ,一 些 计 算 机 体系 结构 提供 了 一 种 寻 址 模式 允许 有 效 地 址 来 自 两 个 寄存 器 内 容 之 和 。 这 被 

36] 称 为 基 址 加 索引 的 寻 址 模式 

每 条 新 指令 和 每 种 新 寻 址 模式 给 实现 增加 了 复杂 性 ， 因 此 需要 非常 小 心地 衡量 其 中 的 利 
次。 这 通常 由 花费 /性 能 分 析 来 完成 。 例 如 ， 为 了 增加 基 址 加 索引 寻 址 模式 ， 我 们 需要 问 以 
下 几 个 问题 : 

1 ) 在 程序 的 执行 中 ， 这 种 寻 址 模式 有 多 常用 ? 

2) 从 减少 指令 条 数 的 角度 来 说 ， 基 址 加 索引 寻 址 模式 相对 于 基 址 加 偏 移 量 寻 址 模式 有 什 
么 优势 ? 

3) 从 执行 时 间 的 角度 来 说 ， 使 用 基 址 加 索引 寻 址 模式 的 加 载 指令 与 使 用 基 址 加 偏 移 量 寻 
址 模式 相 比 需要 付出 什么 代价 ? 

4) 为 了 文 持 基 址 加 索引 寻 址 模式 ， 需 要 什么 额外 的 硬件? 

对 上 面 四 个 问题 的 回答 将 给 我 们 提供 一 个 定量 的 标准 来 判断 是 否 应 该 将 基 址 加 索引 寻 址 


模式 包含 进去 。 
我 们 在 后 面 讨 论处 理 右 实现 和 性 能 影响 时 还 会 回头 考虑 如 何 评价 向 处 理 器 中 添加 新 指令 
和 新 寻 址 模式 ， 


2.6 条件 语句 和 循环 


在 谈论 条 件 语 句 之 前 ， 理 解 程序 执行 时 的 控制 流 概念 是 非常 重要 的 。 在 普通 的 控制 流下 ， 
程序 是 顺序 执行 的 : 


100 I, 
104 i 
108 L 
112 A 
116 A 
120 A 
124 A 
128 a 
132 


BS L AAAs L, ARE hL, 等 。 FRET ear ah. PRA AEP IT aS 
( PC)。 概 念 上 ， 我们 可 以 想象 PC 指向 正在 执行 的 指令 S。 我 们 知道 ， 程 序 并 非 总 是 沿 着 顺序 
[37] 的 控制 流 路 径 执行 。 


日 ”简单 地 说 ， 索 引 值 需要 乘 以 4 然后 加 到 rb 上 来 获得 有 效 地 址 。 只 用 基 址 加 偏 移 量 寻 址 模式 来 装载 a0j] 的 代 
码 留 作 给 读者 的 练习 ， 

O 在 第 3 章 我 们 将 看 到 ， 为 实现 的 功效 着 想 ，PC 包含 着 紧 接 着 现在 正在 执行 的 指令 的 那 条 指令 的 内 存 地 址 。 
然而 需要 注意 的 是 ， 这 只 是 本 书 做 出 的 一 个 简单 的 设计 选择 ， 并 非 是 指令 集 设计 的 必然 。 
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2.6.2 if-then-else 语句 
考虑 下 面 的 语句 : 


f (j 


] == k) go to Ll; 
b + 
a + 


Ll: Lis 

FT RAE in PE LT a BETA. if aL PB 

1) 对 断言 “j= k” RKE: 这 可 以 通过 我 们 已 经 说 过 的 表达 式 求 值 用 的 指令 来 完成 。 

2) 如 果断 言 为 真 ， 那 么 它 将 控制 流 从 下 一 条 语句 改变 到 目标 Ll1。 到 目前 为 止 ， 我 们 的 
指令 集 还 无 法 完成 改变 控制 流 的 任务 。 

因此 ， 我 们 有 必要 添加 这 样 的 新 指令 ， 它 除了 可 以 对 算术 和 逻辑 运算 进行 求 值 ， 还 能 改 
变 控制 流 。 我 们 引入 这 样 一 条 新 指令 : 

beq rl, r2, Ll; 

这 条 指令 的 语义 如 下 : 

1 ) 比较 rl 和 2 

2) 如 果 它 们 相等 ， 那 么 下 一 条 被 执行 的 指令 在 地 址 L1 处 。 

3) 如 果 它 们 不 相等 ， 那 么 下 一 条 被 执行 的 指令 就 是 紧 跟 着 这 条 beq 指令 的 指令 。 

BEQ 是 用 于 改变 控制 流 的 条 件 分 文 指令 的 一 个 例子 。 我 们 在 指令 中 需要 指明 分 支 的 目标 
地 址 。 在 描述 算术 /逻辑 运算 指令 时 ， 我 们 讨论 了 可 寻 址 性 ( 见 2.4.1 49) 并 认为 将 操作 数 放 
在 寄存 器 而 非 指 令 中 是 一 个 好 方法 ， 因 为 这 样 减少 了 指令 用 来 指明 操作 数 的 位 数 。 这 很 目 然 
地 引出 了 分 支 指 令 中 目标 地 址 是 否 需要 放 在 寄存 器 中 而 不 是 作为 指令 一 部 分 这 个 问题 。 也 就 
是 说 ， 地 址 L1 应 该 放 在 寄存 融 中 吗 ?一 条 分 文 指令 通 闻 将 控制 流 从 当前 指令 ( 即 分 文 指令 ) 
带 到 另 一 条 相距 不 是 很 远 的 指令 。 我 们 知道 PC 指向 当前 执行 的 指令 ， 那么 分 支 的 目标 可 以 
用 指令 中 提供 的 相对 于 当前 分 支 指令 位 置 的 地 址 偏 移 量 来 表示 。 鉴 于 从 当前 指令 到 分 支 目 标 
重 令 的 距离 不 是 太 远 ， 所 以 地 址 偏 移 量 只 需要 分 文 指令 中 的 少数 几 位 来 表示 。 换 句 话 说， 用 
分 支 指令 的 一 部 分 作为 内 存 地 址 (确切 地 说 ， 地 址 偏 移 量 ) 来 指定 分 文 目 标 是 合适 的 。 

因此 ， 分 支 指 令 的 格式 如 下 : 

beg rl, r2, offset 

这 条 指令 的 效果 有 : 

1. 比较 rl 和 1r2。 

2. 如 果 它 们 相等 ， 那 么 下 一 条 被 执行 的 指令 的 地 址 为 PC+offsetssuswes O o 

3. 如 果 它 们 不 等 ， 那 么 下 一 条 被 执行 的 指令 就 是 直接 跟 在 beq 指令 后 面 的 指令 。 

我 们 本 质 上 新 增 了 一 种 计算 有 效 地 址 的 寻 址 模式 ， 这 被 称 为 程序 计数 器 相对 寻 址 。 

指令 集体 系 结构 对 于 条 件 分 支 语句 可 能 有 不 同 的 喜好 ， 例 如 BNE (不 等 时 跳 转 )、BZ (为 
零 时 跳 转 )， 以 及 BN (为 负 时 跳 转 )。 

经 常 的 情况 是 ， 在 条 件 语句 中 会 有 一 个 else 分 句 。 


if (j == k) { 
a= b F 63 


} 


else { 


O PC 是 当前 beq 指令 的 地 址 ，offsetsawwes 是 指令 中 给 定 的 偏 移 量 按照 实现 细节 校准 后 的 值 ， 我 们 在 下 一 草 会 
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事实 证 明 我 们 编译 上 面 的 代码 不 需要 在 体系 结构 中 新 增 任何 指令 。 条 件 分 支 指令 非常 有 
效 地 处 理 了 上 面 的 让 语句 有 关 的 计算 和 分 支 。 然 而 ， 当 站 分 句 的 部 分 被 执行 完 之 后 ， 控 制 流 
需要 无 条 件 地 转移 到 L1 ( 紧 接着 else 分 句 的 语句 块 的 开头 )。 

为 了 能 够 这 么 做 ,我 们 引入 “无 条 件 跳 转 ” 语 句 
J Ytarget 
这 里 的 ra 包含 了 无 条 件 跳 转 的 目标 地 址 。 
对 无 条 件 跳 转 指令 的 需求 需要 详细 的 曾 述 ， 毕 竟 我 们 已 经 有 了 条 件 分 文 指令 了 。 无 论 如 何 ， 

我 们 可 以 通过 条 件 分 支 指令 beq 来 实现 无 条 件 分 文 。 当 beq 指令 的 两 个 操作 数 使 用 同一 个 寄存 
器 时 (Bll beq rl, rl, ，offset)， 结 果 就 是 无 条 件 跳 转 。 然 而 ， 这 里 有 一 个 迷惑 人 的 地 方 。 条 件 分 
支 指令 的 范围 受到 偏 移 量 大 小 的 制约 。 比 如 ， 一 个 8 位 的 偏 移 量 (假设 偏 移 量 使 用 补 码 表示 ， 
这 样 正 负 偏 移 量 都 可 以 表示 )， 那 么 分 文 的 范围 被 限制 在 PC-128 ~ PC+127。 这 正 是 引入 新 的 
无 条 件 跳 转 指令 的 原因 ， 在 这 样 的 指令 中 ， 使 用 一 个 寄存 器 来 表示 跳 转 的 目的 地 址 。 

读者 应 该 可 以 明显 感觉 到 ,使 用 条 件 和 无 条 件 分 支 ， 我 们 可 以 编译 任意 多 层级 的 舱 套 if- 


then-else 语句 。 
2.6.2 switch 语句 


许多 高 级 语言 提供 了 特殊 的 条 件 语句 ， 以 C 语言 的 switch 语句 为 代表 。 

switch (k) { 
case 0: 
case 1: 
case 2: 
case 3: 
default: 

} 

如 果 case W BURA PRA Lee, EA TT IE AIX A at A & > if-then-else 
Baw. AA, WRARL ER, AMG case, MAKE IAEA REA if-then- 
else 语句 就 会 生成 低 效 的 代码 。 另 一 种 选择 是 ， 使 用 一 个 跳 转 表 记 录 所 有 case 代码 段 的 起 始 
地 址 ， 这 样 就 能 产生 高 效 的 代码 ( 见 图 2-6 )。 


case | 的 地 址 


case 0 


的 代码 





case 2 


的 代码 





case 2 的 地 址 


跳 转 表 
图 2-6 ”使 用 跳 转 表 实现 switch 语句 。 表 中 的 每 一 项 指向 与 case 值 对 应 的 第 一 条 指令 


case ] 
的 代码 
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原则 上 ， 完 成 这 样 的 实现 不 需要 新 的 指令 。 虽 然 不 需要 往 指 令 集 体系 结构 中 添加 新 的 指 
令 以 支持 switch 语句 ， 但 让 无 条 件 跳 转 语句 支持 一 级 的 间接 寻 址 会 有 很 大 好 处 。 

这 就 是 

J @(rtarget) 
这 里 的 rtarget 包含 了 (无条件) 跳 转 的 目标 地 址 。 

另外 ， 一 些 体 系 结构 提供 了 专用 的 指令 用 于 边界 检查 。 例 如 ，MIPS 体系 结构 提供 了 一 个 
AK Fil AZ (set-on-less-than) 指令 。 

SLT sl, s2, s3 

它 的 效果 是 


if s2 < s3 then set sl to 1 
else set sl to 0 


这 条 指令 对 于 实现 switch 语句 时 的 边界 检查 是 非常 有 用 的 。 
2.6.3 ”循环 语句 
高 级 语言 提供 了 不 同形 式 的 循环 结构 。 考 虑 如 下 代码 片段 


!= 100) go to loop; 


假设 寄存 器 rl FR ej, aE r2 中 包含 值 100， 我 们 可 以 按 下 面 的 方式 编译 


loop: 


bne rl, r2, loop 


因此 ， 不 需要 新 指令 或 寻 址 模式 去 支持 上 述 循环 结构 。 读 者 应 该 能 明显 感觉 到 ， 其 他 一 切 
形式 的 循环 (如 for, while, repeat Œ) 都 能 用 已 经 介绍 过 的 条 件 和 无 条 件 分 支 指令 类 似 地 编译 。 


2.7 WEA 


到 目前 为 止 ， 我们 已 经 看 到 了 下 列 高 级 语言 结构 : 

1 ) 表达 式 和 赋值 语句 ; 

2) 高 级 数据 结构 ; 

3) 条 件 语句 ， 包 括 循环 。 

为 了 有 效 编译 所 讨论 的 结构 ， 我 们 还 为 指令 集体 系 结构 开发 了 以 下 功能 : 

1 ) 使 用 寄存 需 的 算术 / 逻辑 指令 ; 

2) 在 内 存 和 寄存 器 间 搬 移 数 据 的 指令 (加载 和 存储 指令 ); 

3 ) 条 件 和 无 条 件 分 文 指令 ; 

4) 寻 址 模式 : 寄存 器 寻 址 、 基 址 加 偏 移 量 寻 址 、 基 址 加 索引 寻 址 、 程 序 计 数 般 相对 寻 址 。 


2.8 ”编译 函数 调用 
编译 高 级 语言 中 的 过 程 调用 或 函数 调用 有 一 些 需要 特别 注意 的 事情 。 


首先 ， 我 们 来 回顾 程序 员 脑 海中 过 LE FAB Ee 


foo PAŽE Ajo Pe oe A FE : 


pp 2H 


， 程序 在 main efi BCP AA T K% foo. 
FEIT WIFE Hl ae SB FKP AF kb. GBH foo 时 ， p epa main 国 数 中 紧 接 着 调用 


int main() int foo(formal-parameters) 
{ { 
<decl local-variables> <decl local-variables> 
return-value = foo(actual-parms): /* code for function foo */ 


/* continue upon ~«—_———_ return(<value>); 


* returning from foo } 
gi 
} 


首先 我 们 定义 几 个 术语 : 调用 者 (caller) 指 的 是 做 出 过 程 调用 的 实体 (在 这 个 例子 中 是 
main KAŽ); 被 调用 者 (callee) 是 被 调用 的 实体 (例子 中 的 foo) - 


让 我 们 一 一 列 出 编译 一 个 过 程 调 用 的 步 又 : 


1 ) 保证 调用 者 的 状态 ( 即 调用 者 使 用 的 寄存 器 ) 被 保护 好 以 便 从 过 程 调用 中 返回 时 得 以 恢复 。 


2 ) 将 实际 参数 传递 给 被 调用 者 
3 ) 记 住 返回 地 址 . 
) 将 控制 权 转 交 给 被 调用 者 . 
) 为 被 调用 者 的 局 部 变量 分 配 空间 。 
6 从 被 调用 者 接收 返回 值 并 传 给 调用 者 . 
7 ) 返回 调用 点 


我 们 现 有 的 指令 集体 系 结构 的 功能 能 够 满足 前 面 这 些 要 求 吗 ? 为 了 回答 这 个 问题 ， 我 们 


过 
节 考 虑 余下 的 杂 


2.8.1 调用 者 的 状态 


首先 定义 什么 是 调用 者 的 状态 。 执 行 被 调用 者 代码 所 需 的 资源 有 内 存 (被 调用 者 的 代码 和 数 
它们 )。 编 详 天 会 确保 调用 者 和 被 调用 


据 ) 和 处 理 器 中 的 寄存 此 (所 有 的 算术 / 导 辑 指令 会 都 用 到 


者 使 用 不 同 的 内 存 (例外 情况 是 高 级 语言 的 语义 要 求 的 共享 内 存 )。 


容 才 是 我 们 需要 担心 的 “状态 ”"， 因 为 当 调 用 者 调用 被 调用 
者 时 ， 它 自身 的 某 些 结果 正 存 储 在 寄存 器 中 。 因 为 我 们 不 
知道 被 调用 者 将 使 用 哪些 寄存 带 ， 谨 愤 的 做 法 是 在 过 程 调 
用 前 先 将 它们 都 保存 起 来 ， 然 后 在 返回 时 再 恢复 。 

现在 我 们 需要 一 个 地 方 来 保存 这 些 寄存 器。 我 们 先 
尝试 硬件 的 解决 方案 。 我 们 引入 一 个 影子 寄存 器 组 ， 我 
们 将 在 调用 前 把 寄存 器 保存 到 里 面 ， 从 过 程 中 返回 时 再 
将 这 个 影子 寄存 器 组 中 的 值 恢 复 到 处 理 咒 的 寄存 硕 中 
( 见 图 2-7 ). 

我 们 知道 ， 在 模块 化 的 代码 中 ,过 程 的 调用 是 很 频 
繁 的 ， 因 此 快速 地 保存 /恢复 状态 非常 重要 。 鉴 于 影子 
寄存 器 组 位 于 处 理 器 内 部 ， 而 所 有 的 保存 /恢复 操作 都 


所 以 ， 处 理 器 的 寄存 顺 中 的 内 


在 过 程 调用 前 保存 





图 2-7 


在 过 程 返 回 时 恢复 


过 程 调用 /返回 时 状态 的 保 
存 / 恢 复 。 在 调用 过 程 时 ， 
将 寄存 器 保存 在 影子 寄存 需 
组 中 ， 在 返回 时 恢复 
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发 生 在 使 件 层 面 ， 所 以 影子 寄存 器 组 看 起 来 是 个 好 主意 . 

这 个 想法 的 最 大 问题 在 于 ， 它 假设 被 调用 的 过 程 不 会 再 进一步 调用 其 他 过 程 了 。 根据 我 
们 写 高 级 语言 程序 的 经 验 ， 这 个 假设 完全 站 不 住 脚 。 实 际 上 ， 我 们 需要 与 嵌 套 过 程 调用 的 层 
数 一 样 多 的 影子 寄存 带 组 ( 见 图 2-8 ). 


maln 一 一 一 一 一 > foo —— bar = baz 







ETA 
存 器 组 







影子 寄 
fF airZHl 






影子 寄 
存 器 组 |…… 


图 2-8” 挫 套 的 过 程 调用 中 状态 的 保存 和 恢复 。 将 影子 寄存 融 组 的 想法 扩展 至 一 个 航 套 的 
过 程 调用 序列 


我 们 来 讨论 硬件 实现 这 些 影 子 寄存 右 组 的 意义 。 肉 套 过 程 调用 ( 即 图 2-8 中 的 链 ) 的 层 数 
是 程序 的 动态 属性 。 硬 件 解决 方案 必须 是 有 限 的 ， 与 影子 寄存 融 组 的 数量 相关 。 并 且 由 于 成 
本 和 复杂 性 的 原因 ， 这 个 数量 不 能 任意 大 。 尽管 如 此 ， 还 是 有 的 体系 结构 ， 如 SPARC， 为 此 
实现 了 一 种 称 为 寄存 器 窗口 的 硬件 机 制 。SPARC 提供 了 128 个 硬件 寄存 器 ， 但 任意 时 刻 都 只 
有 32 个 是 可 见 的。 那些 不 可 见 的 寄存 器 就 成 了 影子 寄存 需 组 ， 像 图 2-8 所 示 的 那样 工作 。 

图 2-8 还 向 我 们 提示 了 一 种 可 能 的 软件 实现 方案 : 使 用 你 们 可 能 已 经 在 数据 结构 中 学 习 
过 的 栈 。 我 们 在 调用 点 将 状态 保存 入 栈 中 ， 在 返回 的 时 候 恢 复 。 因 为 栈 有 具有 后 进 先 出 (LIFO) 
的 特性 ， 它 正好 满足 了 舱 套 过 程 调 用 的 需求 。 

栈 可 以 通过 软件 的 抽象 在 内 存 中 实现 ， 所 以 就 不 受 散 套 层次 的 限制 了 。 

编译 器 需要 维护 一 个 指向 栈 的 指针 以 保存 和 恢复 状态 。 这 并 不 需要 在 体系 结构 上 添加 任 
何 新 东西 。 编 译 器 会 选择 处 理 器 中 的 一 个 寄存 器 作为 专用 的 栈 指针 。 注 意 ， 这 并 不 是 体系 结 
构 必 需 的 要 求 ， 而 仅仅 是 为 编译 器 提供 方便 。 另 外 ， 每 个 编译 器 都 有 选择 不 同 寄 存 器 作为 栈 
指针 的 自由 。 这 指 的 是 编译 器 将 不 会 使 用 这 个 寄存 器 来 保存 程序 变量 ， 因 为 栈 指针 已 经 被 保 
留 作 为 编译 器 内 部 的 专用 功能 了 . 

刚才 我 们 通过 选 定 一 个 寄存 器 作为 栈 指针 来 说 明了 软件 使 用 寄存 天 的 惯例 。. 

硬件 解决 方案 的 一 个 好 处 是 ， 它 是 用 硬件 实现 的 ， 所 以 很 快 。 现 在 我 们 用 软件 方式 来 实 
现 栈 ， 代 价 是 每 次 过 程 调用 和 返回 时 需要 在 内 存 和 处 理 需 寄存 需 之 间 来 回 搬运 数据 。 想 想 看 
能 不 能 既 保 持 软 件 方式 的 弹性 ， 又 具有 硬件 方式 的 性 能 优势 呢 ? 软件 方式 无 法 达到 硬件 方式 
的 高 速 ， 但 确实 可 以 减少 那些 浪费 的 部 分 

先 探 讨 一 下 在 每 次 调用 和 返回 的 时 候 是 否 真 的 需要 保存 或 恢复 所 有 的 寄存 项。 之 前 的 途 
径 是 调用 者 ( 即 代表 调用 者 的 编译 器 ) 负责 保存 和 恢复 。 如 果 被 调用 者 根本 没有 使 用 任何 寄存 
器 ， 那 么 整个 保存 和 恢复 寄存 器 的 工作 都 白 做 了 。 因 此 ， 我 们 可 以 把 这 个 工作 交 给 被 调用 者 ， 
让 它 在 运行 时 保存 将 要 使 用 的 寄存 器 而 在 过 程 返回 时 恢复 它们 。 同样 地 ， 如 果 调 用 者 在 过 程 
返回 后 根本 不 使 用 这 些 寄存 器 里 的 值 ， 那 么 这 个 工作 也 白费 了 。 
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为 了 走出 这 个 困境 ， 让 我 们 再 扩展 一 下 软件 惯例 的 想法 。 这 里 打 个 比方 来 帮助 大 家 理解 。 

这 是 一 个 关于 两 个 懒惰 的 室友 的 故事 。 a 但 是 ， 他 们 每 天 都 得 吃 

饭 ， 所 以 最 终 他 们 达成 了 一 个 协议 。 他 们 有 一 个 公用 的 盘子 ， 每 个 人 有 各 自 的 几 个 碟子 。 他 
们 决定 遵守 的 规则 如 下 : 

© 自己 的 碟子 永远 都 不 需要 清洗 。 

© 如果 使 用 了 别人 的 碟子 ， 那 么 每 次 用 完 后 必须 洗 干 净 。 

。 盘子 并 不 保证 是 干净 的 ， 所 以 每 个 人 在 用 盘子 之 前 ， 如 果 需 要 的 话 ， 最 好 是 自己 洗 一 遍 。 

有 了 这 个 惯例 ， 每 个 人 的 工作 都 只 剩 一 点 了 一 一 如 果 他 们 不 使 用 盘子 和 别人 的 碟子 ， 那 
么 根本 就 不 需要 工作 ! 

过 程 调用 的 软件 惯例 采取 的 方式 和 这 个 懒 人 比喻 差不多 。 当 然 ， 过 程 调用 与 这 个 比喻 不 
同 的 是 ， 它 是 不 对 称 的 (存在 着 调用 者 与 被 调用 者 的 秩序 )。 调 用 者 获得 寄存 器 中 属于 他 自己 
的 一 个 子 集 ( 称 为 s 寄存 器 组 )。 调 用 者 可 以 任意 使 用 这 些 寄存 器 ， 不 用 担心 被 调用 者 会 冲 掉 
里 面 的 数据 。 被 调用 者 如 果 需 要 使 用 s 寄存 器 组 ， 则 需要 保存 和 恢复 它们 。 与 盘子 类 似 ， 还 
有 一 部 分 寄存 需 〈 称 为 1 寄存 天 组 ) 是 调用 者 和 被 调用 者 所 共有 的 。 它 们 使 用 这 些 寄存 器 都 不 
需要 保存 或 恢复 。 现 在 ， 正 如 懒 人 比喻 里 的 那样 ， 如 果 调 用 者 在 过 程 返回 后 不 使 用 t 寄存 带 
组 中 的 值 ， 那 么 在 过 程 调用 时 就 不 需要 干 活 。 同 样 地 ， 如 果 被 调用 者 不 使 用 s 寄存 器 组 ， 那 
么 它 也 不 需要 考虑 保存 和 恢复 的 事情 。 

寄存 器 的 保存 和 恢复 将 在 栈 中 实现 。 当 我 们 讨论 完 过 程 调用 和 返回 的 其 他 工作 之 后 ,还 
会 接着 补 全 关于 过 程 调用 和 返回 的 软件 惯例 。 


2.8.2 过程 调 用 剩余 的 工作 


1 ) 参数 传递 ”一 种 权宜 之 计 是 ， 使 用 处 理 融 中 的 寄存 顺 来 传递 参数 。 再 一 次 地 ， 编 译 骨 
将 建立 一 套 软件 惯例 ， 将 某 些 寄存 咒 保留 供 传 参 专用 。 

当然 ， 过 程 所 需 的 参数 个 数 可 能 会 超过 这 些 寄存 带 数 量 的 限制 。 这 种 情况 下 ， 编 详 带 会 使 
用 栈 来 传递 多 出 的 这 些 参 数 。 软 件 惯例 保证 被 调用 者 借助 于 栈 指针 知道 在 栈 中 的 何 处 取得 参数 。 

2) 记 住 返回 地 址 我 们 在 之 前 讲 分 支 指令 时 提 到 过 处 理 占 中 的 程序 计数 各 (PC). i> 
为 止 我 们 介绍 过 的 高 级 语言 结构 都 不 需要 记 住 自己 位 于 程序 何 处 。 所 以 ,现在 需要 一 条 新 的 
指令 将 PC 值 保 存在 一 个 众所周知 的 地 方 ， 以 便 能 在 过 程 返回 中 使 用 它 。 

我 们 引入 一 条 新 的 指令 : 

JAL Yeargetr Tlink 

这 条 指令 的 语义 如 下 : 

o 将 返回 地 址 保存 在 Tin 中 《〈 可 以 是 任意 一 个 处 理 器 的 寄存 器 )。 

。 将 PC BON Tara 中 的 值 ( 即 被 调用 者 的 起 始 地 址 )。 

我 们 回 到 软件 惯例 的 问题 上 来 。 编 译 器 会 指定 一 个 寄存 需 作 为 roe 来 保存 目标 例 程 的 地 
址 ， 而 指定 另 一 个 寄存 器 作为 nx 来 保存 返回 地 址 。 也 就 是 说 ， 这 些 寄存 天 将 不 能 用 来 存放 
普通 的 程序 变量 。 

因此 ， 在 调用 点 ， 过 程 调用 被 编译 为 

JAL rtargets Flink? /* Itarget Containing the address 

从 过 程 中 返回 的 方式 很 直接 ， 因 为 我 们 已 经 有 无 条 件 跳 转 指令 了 ， 


可 工 1ink 
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完成 了 从 过 程 调用 中 返回 的 任务 . 
3 ) 将 控制 权 移交 给 被 调用 者 ”第 3 步 是 通过 JAL 指令 将 控制 权 移 交 给 被 调用 者 。 
4) 被 调用 者 局 部 变量 的 空间 ”使 用 栈 可 以 很 方便 地 为 被 调用 者 所 需 的 局 部 变量 分 配 空 
间 。 软 件 惯例 保证 了 被 调用 者 借助 于 栈 指 针 可 以 方便 地 找到 局 部 变量 的 所 在 8 。 
5 ) 返回 值 ”一 个 方法 是 编译 天 保留 某 些 寄存 带 用 于 返回 值 。 与 参数 传递 时 相同 ， 如 果 返 
回 值 超 出 了 这 些 寄 人 存 顶 能够 保存 的 能 力 范 围 ， 剩 余 的 返回 值 将 通过 栈 进行 传递 。 软 件 惯 例 保 
证 了 调用 者 依 助 于 栈 指针 能 够 找到 返回 值 。 
6 ) 返回 到 调用 点 ”正如 前 面 提 到 的 ， 人 简单 的 一 条 跳 转 到 mw 的 指令 就 能 将 控制 权 交 回 到 
调用 点 。 


2.8.3 软件 惯例 


为 了 让 讨论 更 具体 些 ， 我 们 这 里 介绍 一 套 处 理 融 寄存 顺 及 其 使 用 的 软件 惯例 : 
。 ATAN sO ~ s2 是 调用 者 的 寄存 需 . 
。 寄存 器 t0 ~ 12 是 临时 寄存 器 。 
。 寄存 器 a0 ~ a2 是 传 参 寄 存 器 。 
寄存 需 VO 用 于 保存 返回 值 
寄存 需 ra 用 于 保存 返回 地 址 。 
寄存 人 at 用 于 保存 目标 地 址 。 
ay ff ait sp 用 作 栈 指针 。 
在 展示 如 何 使 用 这 些 软件 惯例 来 编译 过 程 调用 之 前 ， 我 们 需要 强调 一 些 栈 的 细节 。 许 多 
编译 器 采用 的 惯例 是 ， 栈 从 高 地 址 往 低 地 址 增长 。 基 本 的 栈 操作 如 下 : 
。 压 栈 (push) 减 小 栈 指 针 并 将 值 保存 于 栈 指 针 指 癌 的 内 存 中 。 
e 弹出 (pop) 取出 栈 指 针 指 向 的 值 并 增 大 栈 指 针 。 
图 2-9 ~ 图 2-20 展示 了 编译 需 产 生 的 运行 时 生成 栈 帧 的 代码 。 在 所 有 的 图 中 ， 低 地 址 是 
栈 的 顶部 而 高 地 址 是 栈 的 底部 ， 与 栈 从 高 地 址 往 低地 址 增长 一 致 。 


第 1 步 : 调用 者 保存 t ~ 全 
寄存 器 到 栈 中 (如 果 它 在 过 程 AT | 
返回 后 需要 用 到 这 些 值 的 话 )。 







SKA tAE 


保存 的 t 寄 存 器 组 


图 2-9 过程 调用 与 返回 第 1 步 


日 ”实际 上 ， 因 为 我 们 现在 有 JAL 指令 .我 们 可 以 用 这 条 指令 来 实现 无 条 件 跳 转 。JAL Thinks Taontcare 将 无 条 件 跳 
转 到 mw 所 指向 的 位 置 ， 此 处 的 rw 表示 被 忽略 
是 “练习 题 18 中 有 这 个 描述 的 一 个 变种 。 
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a0 ~ a2 FP (有 必要 的 
话 使 用 栈 来 放置 更 多 的 参数 )。 






来 自 函数 调用 


图 2-10 过程 调用 与 返回 第 2 步 


第 3 步 : 调用 者 为 额外 的 返回 
值 在 栈 中 分 配 空间 。 





esc ae 


额外 的 参数 
保存 的 t 寄 存 带 组 


图 2-11 过程 调 用 与 返回 第 3 步 





第 4 步 : 调用 者 将 上 一 层 的 返 
回 地 址 ， 即 当前 ra 寄存 器 中 
的 值 保存 在 栈 中 。 










额外 的 返回 值 
额外 的 参数 
保存 的 + 寄存 器 组 


图 2-12 ”过程 调用 与 返回 第 4 步 


Ab EB Fs tk HR Ze FY 
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栈 
上 一 层 的 返回 地 址 
额外 的 返回 值 


HA NIA 


第 5 步 : 调用 者 执行 JAL 指令 
(不 对 栈 产生 影响 )。 






保存 的 + 寄存 器 组 


图 2-13 ”过 程 调用 与 返回 第 5 步 


第 6 步 : 被 调用 者 保存 它 将 使 
用 的 sO ~ s3 中 的 寄存 器 。 











页 外 的 参 
保存 的 + 寄存 需 组 


图 2-14 过程 调用 与 返回 第 6 步 


第 7 步 : 被 调用 者 在 栈 上 给 局 
部 变量 分 配 空间 。 






a 


图 2-15 过程 调用 与 返回 第 7 步 


栈 
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第 8 步 : 返回 之 前 ， 被 调用 者 
恢复 保存 在 栈 中 的 s0 ~ s3 A 
FF Rit o 










-一 层 的 返回 地 址 


图 2-16 过 程 调用 与 返回 第 8 步 


第 9 步 : 返回 时 ， 调 用 者 将 之 
前 的 返回 地 址 恢复 到 ra 中 。 











额外 的 返回 值 
额外 的 参数 
保存 的 t 寄存 带 组 


图 2-17 ”过程 调 用 与 返回 第 9 步 


第 10 步 : 调用 者 根据 需要 恢 
复 额 外 的 返回 值 。 









额外 的 参数 
保存 的 1 寄存 器 组 


图 2-18 过程 调用 与 返回 第 10 步 


第 11 步 : 返回 时 ， 调 用 者 移 
动 栈 指针 ， 丢 弃 额 外 的 参数 。 





图 2-19 ”过 程 调用 与 返回 第 11 步 


第 12 步 : 返回 时 ， 调 用 者 恢 
复 保 存在 栈 中 的 t0 ~ t3 寄存 





图 2-20 过程 调用 与 返回 第 12 步 


2.8.4 活动 记录 


栈 中 与 当前 执行 的 过 程 有 关 的 一 部 分 区 域 被 称 为 该 过 程 的 活动 记录 。 活动 记录 是 调用 者 
与 被 调用 者 之 间 进 行 通信 的 区 域 。 图 2-9 ~ 图 2-19 显示 了 调用 者 和 被 调用 者 之 间 如 何 建立 活 
动 记录 ， 被 调用 者 如 何 使 用 活动 记录 ， 以 及 返回 时 (调用 者 和 被 调用 者 ) 如 何 拆除 活动 记录 。 
依赖 于 过 程 调用 的 嵌 套 ， 栈 上 可 能 会 有 多 个 活动 记录 存在 。 但 是 在 任意 时 刻 ， 都 有 且 仅 有 一 
个 与 当前 正在 执行 的 过 程 有 关 的 活动 记录 是 在 活动 的 。 

考虑 下 面 的 序列 : 


main 一 一 一 2 foo -—> bar 一 -一 > baz 一 > 
一 <——— 





图 2-21 展示 了 前 面 这 个 调用 序列 的 活动 记录 和 栈 的 情况 。 
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R 
N 
‘Re 










局 部 变量 


保存 的 s 寄存 器 组 
baz 的 活动 


bar 的 活动 额外 的 返回 值 
栈 帧 








额外 的 参数 


foo 的 活动 
栈 帧 


保存 的 + 寄存 器 


bd 









main 的 活动 
FE Hol 


Se i =H = A 
= j \ 
\ 


图 2-21 调用 序列 的 活动 记录 。 注 意 ， 只 有 最 顶端 的 活动 记录 才 是 对 当前 执行 的 过 程 有 意义 的 


2.8.5 ”递归 


对 程序 员 来 说 ， 最 有 力 的 工具 莫 过 于 递归 了 。 我 们 不 需要 在 指令 集体 系 结构 上 增加 任何 
东西 就 能 支持 递归 。 栈 机 制 保证 了 过 程 的 每 个 实例 (无 论 它们 是 属于 相同 还 是 不 同 的 过 程 ) 者 
拥有 一 个 新 的 活动 记录 。 当 然 ， 能 被 递归 调用 的 过 程 必须 写成 支持 递归 的 代码 ， 这 是 程序 员 
考虑 的 范围 。 指 令 集 为 了 不 需要 做 任何 改变 就 能 文 持 递归 。 


2.8.6 ” 帧 指针 


在 程序 执行 的 过 程 中 显而易见 的 是 ， 必 须 能 够 定位 放 在 栈 上 的 所 有 东西 的 位 置 。 在 程序 
执行 之 前 ， 它 们 的 绝对 位 置 是 不 知道 的 。 很 明显 它们 能 够 通过 用 栈 指针 的 偶 移 量 表示 出 来 ， 
但 这 条 途径 有 一 个 问题 。 某 些 编译 器 会 生成 在 函数 执行 过 程 中 ( 即 栈 帧 已 经 建 好 之 后 ) 修改 栈 
指针 的 代码 。 例 如 ， 一 些 语言 支持 在 栈 上 动态 分 配 。 尽 管 可 以 跟踪 栈 指针 的 移动 ， 但 是 这 市 
来 的 需要 额外 维护 的 信息 以 及 在 运行 时 间 上 的 代价 决定 了 这 是 一 个 鳗 主 意 。 常 用 的 解决 方案 
是 指定 一 个 通用 寄存 器 作为 帧 指针 ， 包 含 在 当前 函数 的 活动 记录 中 的 一 个 已 知 的 位 置 。 在 函 
数 执行 过 程 中 ， 这 个 地 址 是 不 会 改变 的 。 用 一 个 例子 来 理 清 这 个 问题 和 解决 方案 。 考 虑 下 面 
的 过 程 : 


int foo(formal-parameters ) 


{ 


int a, bs 

/* 一 些 代 码 */ 

if (a > b) £ (1) 
int c = ls; (2) 
a=at+b+t+o; (3) 

} 

printf("%d\n, a); (4) 


/* foo 的 更 多 代码 */ 


/* 
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* M foo KH 
* / 
return(0); 


} 

我 们 假设 栈 指针 (用 $sp 表示 ) 在 调用 foo 的 第 6 步 (UL 2-14) 之 后 的 值 是 100。 在 第 
7 步 中 ， 被 调用 者 为 局 部 变量 (a 和 b) 分 配 了 空间 。 按 照 栈 从 高 地 址 向 低地 址 增长 的 惯例 ，a 
被 分 配 在 地 址 96 而 b 被 分 配 在 地 址 92。 现 在 $sp 的 值 是 92 了 。 图 2-22 展示 了 这 个 情况 。 


COPE 


分 配 局 部 变量 
之 前 栈 中 的 其 
他 内 容 





图 2-22 过程 中 的 局 部 变量 分 配 之 后 栈 的 状态 。 注 意 现在 栈 指针 的 值 是 92。 


foo 过 程 开始 执行 。" if” 语 句 生 成 的 代码 需要 将 a 和 b 装 人 寄存 器 中 。 这 对 编译 需 来 说 
非常 直截了当 。 下 面 的 两 条 指令 


ld r1, 4($sp); /* #a#Ari, a 的 地 址 为 Ssp+offset 
ld r2, O($sp); /*#b#Ar2, bb 的 地 址 为 $sp+offset 


将 a Al b TIRARA rl Al r2 中 。 
注意 ， 如 果 上 一 步 计 算 正 确 的 话 ， 下 一 步 会 发 生 什 么 呢 ? 现在 程序 新 分 配 了 一 个 变量 c， 
它 也 是 在 栈 中 分 配 的 。 然 而 ， 这 个 局 部 变量 的 分 配 并 不 在 foo 的 执行 前 ( 见 图 2-1$， 第 7 步 ) 


进行 。 这 是 个 有 条 件 的 分 配 ， 只 在 if 语 句 为 真 的 时 候 进行 。 变 量 c 的 地 址 是 88， 现 在 $sp 的 
值 是 88。 图 2-23 展示 了 现在 的 情况 。 


92 +4 
92 + 0 


96*/ 
92*/ 


分 配 局 部 变量 
之 前 栈 中 的 其 
他 内 容 





图 2-23 ”变量 c 分 配 之 后 栈 的 状态 ， 此 时 对 应 着 过 程 中 的 语句 (2 )。 注 意 现在 栈 指 针 的 值 是 92 

在 证 语句 块 中 ， 我 们 可 能 需要 加 载 和 存储 变量 a 和 b ( 见 代 码 块 中 的 语句 3 )。 生 成 变 
量 a 和 bb 的 正确 地 址 是 个 诡异 的 问题 。 原 来 变量 a 对 于 Ssp 的 偏 移 量 是 4， 现 在， 对 于 当前 
的 Ssp 来 说 ， 偏 移 量 则 是 8。 因此， 在 语句 (3) 中 为 了 加 载 变 量 a 和 b， 编 译 需 需要 生成 下 
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面 的 代码 : 


ld rl, 4(S$sp); /* 将 a 载 入 rl, a 的 地 址 为 Ssp+offset = 88 + 8 = 96*/ 
ld r2, 0($sp); /* 将 b 载 入 r2, b 的 地 址 为 Ssp+toffset = 88 + 4 = 


当 让 语句 执行 完毕 之 后 , c 被 从 栈 中 释放 掉 ，$sp 又 变 成 了 92。 现 在 a 对 于 当前 Ssp 的 偏 
移 量 又 是 4 了 。 这 与 图 2-22 所 表示 的 是 一 样 的 。 

读者 可 以 看 出 ， 栈 能 够 扩大 和 缩小 这 个 事实 使 得 编译 器 更 难 写 了 。 依 赖 于 当前 的 栈 指 针 ， 
各 个 局 部 变量 的 偏 移 量 都 在 改变 。 

这 正 是 选择 寄存 右 作 为 帧 指针 的 原因 。 帧 指针 包含 了 栈 中 与 被 执行 过 程 相关 的 活动 记录 
的 第 一 个 地 址 ， 并 且 在 这 个 过 程 的 执行 过 程 中 都 不 会 改变 。 当 然 ， 如 果 该 过 程 又 调用 了 别 的 
过 程 ， 则 它 的 帧 指针 也 需要 进行 保存 和 恢复 ， 这 由 被 调用 者 来 完成 。 因 此 ， 被 调用 者 所 做 的 


saad | 新 的 第 6 步 : 被 调用 者 保 
存 之 前 的 帧 指针 并 将 栈 指 
针 的 内 容 复 制 到 帧 指针 中 。 





返回 地 址 





额外 的 返回 值 





额外 的 参数 


保存 的 1 寄存 器 
* 过 程 执行 过 程 中 ， 栈 指针 可 能 会 发 生变 化 
图 2-24 with Ft 


这 个 帧 指针 是 栈 上 一 个 固定 的 套子 (对 于 一 个 过 程 来 说 )， 它 指向 当前 执行 的 过 程 的 活动 
记录 (AR) 的 首 地 址 。 


2.9 ”指令 集体 系 结构 选择 

在 本 节 中 ， 我 们 总 结 关于 指令 集 设计 的 体系 结构 的 不 同 选择 。 这 种 选择 存在 于 指令 集中 
的 算术 / 逻辑 运算 、 寻 址 模式 、 体 系 结构 类 型 ， 以 及 实际 内 存 的 布局 ( 即 指令 格式 ) 中 。 有 时 
候 ， 做 出 这 些 选 择 是 由 于 当前 的 技术 趋势 和 硬件 的 可 行 性 考虑 ， 有 时 候 则 是 为 了 对 高 级 语言 
结构 提供 精简 而 高 效 的 支持 。 


2.9.1 额外 的 指令 
有 的 体系 结构 提供 了 额外 的 指令 ， 以 提升 编译 出 的 代码 的 空间 和 时 间 的 有 效 性 。 
。 例如， 在 MIPS 体系 结构 中 ， 加 载 和 存储 指令 都 是 对 于 一 整个 32 位 的 数 进行 操作 的 。 
然而 ,一 旦 指令 被 装 到 了 寄存 器 中 ， 特 殊 的 指令 就 可 以 用 来 扩展 其 中 某 个 特定 的 字 市 


A 


到 另 一 个 寄存 器 中 ; Zeb, thay PES AGAR TT 


AE FE Fs KAR BE PY 39 


¢ DEC 的 Alpha 指令 集 包 含 了 加 载 和 存储 不 同 粒度 操作 数 的 指令 : 字 节 、 半 字 、 字 和 四 字 。 
。 一 些 体系 结构 包含 预定 义 的 立即 数 (如 0、1 及 其 他 小 整数 )， 可 以 直接 在 指令 中 使 用 。 
e DEC VAX 体系 结构 可 以 用 单条 指令 来 存储 / 加载 寄存 器 文件 中 的 所 有 寄存 器 到 内 存 或 
者 从 内 存 中 取出 它们 。 也 许 有 人 会 认为 ,这 样 的 指令 有 利于 在 过 程 调用 的 时 候 进行 寄 
存 器 的 保存 和 恢复 。 读 者 应 该 根据 本 章 前 面 的 内 容 ， 考 虑 一 下 这 种 指令 在 过 程 调用 中 
的 实用 性 。 


2.9.2 ”额外 的 寻 址 模式 


在 我 们 已 经 讨论 过 的 寻 址 模式 之 外 ， 有 的 体系 机 构 还 提供 了 更 花哨 的 寻 址 模式 。 
。 许 多 体系 机 构 提供 了 间接 寻 址 模式 : 


ld @(ra) 

ERHO, ATE aR ra 的 内 容 是 实际 内 存 操作 数 的 地 址 的 地 址 。 

MIPS 提供 了 这 样 一 种 类 型 的 寻 址 模式 ， 它 使 用 PC 的 高 6 位 以 及 它 本 身 的 低 26 位 构成 

一 个 32 位 的 有 效 地 址 : [58| 


| 指令 的 低 26 位 


早期 的 体系 结构 如 IBM 360, PDP-11 和 VAX11 支持 的 寻 址 模式 远 比 我 们 在 本 章 中 讨论 
的 多 。 大 部 分 现代 体系 结构 在 访问 的 内 存 的 寻 址 模式 方面 走 的 是 最 少 化 路 线 。 这 主要 是 因为 ， 
这 么 多 年 来 ， 实 际 被 编译 器 使 用 的 复杂 寻 址 模式 非常 少 。 甚 至 基 址 加 偏 移 量 在 MIPS 体系 结 
构 中 也 是 没有 的 ， 尽 管 IBM PowerPC 和 Inter Pentium 都 支持 这 种 模式 。 


2.9.3 体系 结构 类 型 


历史 上 曾经 有 过 好 几 种 不 同 的 体系 结构 类 型 : 

。 面向 栈 的 体系 结构 “Burroughs Computers 公司 引入 了 面向 栈 的 体系 结构 ， 在 这 种 体系 
结构 中 ， 所 有 的 操作 数 都 是 在 栈 上 的 。 所 有 的 指令 都 操作 位 于 栈 上 的 操作 数 。 

。 面向 内 存 的 体系 结构 IBM 360 系列 机 着 眼 于 面 回 内 存 的 体系 结构 ， 大 部 分 (如 果 不 是 
全 部 的 话 ) 指令 都 是 操作 内 存 中 的 操作 数 。 

。 面 向 寄存 器 的 体系 结构 ”正如 在 本 章 讨论 的 ， 这 种 体系 结构 中 的 大 部 分 指令 处 理 的 是 
寄存 器 中 的 操作 数 。 随 着 编译 技术 日 趋 成 熟 ， 以 及 处 理 需 中 寄存 硕 的 有 效 使 用 ， 这 种 
风格 的 体系 结构 最 终 保留 了 下 来 。DEC Alpha 和 MIPS 都 是 这 种 风格 的 体系 结构 。 

。 混合 类 型 ”通常 来 说 ， 针 对 特定 的 应 用 ， 可 以 选择 其 中 某 一 种 类 型 的 体系 结构 。 因 此 ， 
很 自然 的 ， 这 些 类 型 的 混合 体 非常 受 欢 迎 。IBM PowerPC 和 Intel x86 系列 指令 集 都 是 
面向 内 存 和 面向 寄存 天 的 混合 类 型 。 


2.9.4 指令 格式 


根据 所 有 指令 结构 的 不 同 ， 它 们 被 分 为 以 下 几 类 : 
1. 零 操 作 数 指令 
例子 包括 : 
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© HALT (fF IE Abs A ) 

© NOP (什么 部 不 做 ) 

另外， 如 果 体 系 结构 是 面向 栈 的 ， 对 于 大 部 分 指令 (除了 压 栈 和 出 栈 的 值 是 显 式 的 )， 它 
们 的 操作 数 都 是 隐 含 的 。 在 这 种 体系 结构 中 指令 看 起 来 是 这 样 的 : 

© ADD (弹出 栈 项 的 两 个 元 素 ， 将 它们 相 加 ， 并 将 结果 压 入 栈 中 ) 

。PUSH<operand> (将 操作 数 压 人 栈 中 ) 

。 POP<operand> (将 栈 顶 元 素 弹 出 作为 操作 数 ) 

2. 单 操作 数 指令 

这 种 类 型 的 指令 通 当 与 高 级 语言 中 的 一 元 运算 特有 关 : 

。 INC/DEC <operand> (将 指定 操作 数 增加 或 减少 某 个 常数 值 ) 

e NEG<operand> ( 取 操 作 数 的 补 码 ) 

© NOT<operand> ( 取 操 作 数 的 反 人 码 ) 

男 外 ， 无 条 件 转 移 指令 通常 也 只 有 一 个 操作 数 : 

e J <target> (PC + target) 

此 外 ,一 些 老式 机 大 (如 DEC 的 PDP-8 ) 使 用 一 个 隐 合 的 操作 数 (PRA RDN es, ACC) 
和 一 个 显 式 操作 数 。 这 种 体系 结构 中 的 指令 看 起 来 是 这 样 的 : 

e ADD<operand> (ACC «— ACC+operand) 

e STORE<operand> (operand «— ACC) 

e LOAD<operand> (ACC < operand) 

3. 双 操 作 数 指令 

这 类 指令 同样 映射 为 高 级 语言 中 的 二 元 运算 符 。 其 基本 思想 是 在 二 元 运算 中 ， 一 个 操作 
数 既 是 源 操作 数 也 是 目标 操作 数 . 

e ADD R1, R2 (RI «— R1+R2) 

移动 数据 的 指令 也 属于 这 一 类 : 

s MOV R1, R2 (R1 «— R2) 

4. 三 操作 数 指令 

这 是 最 常见 的 类 型 ， 在 这 一 整 章 里 我 们 都 能 看 到 它 的 例子 ， 比 如 : 

© ADD Rags Kars Reg (Rast *— Rarer + Revco ) 

e LOADR, Rb, offset (R + MEM[Rbtoffset] ) 

指令 格式 指 的 是 指令 如 何在 内 存 中 布局 。 一 个 体系 结构 会 包含 上 述 各 种 风格 的 指令 ， 由 
许多 要 求 不 同 数量 操作 数 的 指令 组 成 。 

典型 的 指令 具有 下 面 的 格式 : 


操作 码 操作 数 说 明 符 


在 设计 指令 格式 的 问题 上 ， 我们 要 考虑 实际 的 实现 。 因 为 指令 格式 的 选择 对 于 设计 的 空 
间 和 时 间 有 效 性 来 说 是 个 关键 点 。 与 之 相关 的 选择 是 指令 中 各 字段 的 实际 编码 ， 即 在 某 个 给 
定 字段 上 用 怎样 的 位 串 表 达 何 种 语义 。 例 如 ， 表 示 ADD 的 位 串 ， 等 等 。 
广义 上 讲 ， 所 有 指令 格式 分 为 两 关 : 
。 所 有 指令 等 长 ”在 这 种 格式 中 ， 所 有 的 指令 都 有 相同 的 长 度 ( 即 一 个 内 存 字 长 度 )。 意 
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思 是 指令 的 某 一 位 根据 指令 的 不 同 会 有 不 同 的 含义 : 
。 优势 : 
。 指令 长 度 固 定 简 化 了 实现 。 
。 只 要 拿 到 了 指令 ， 马上 就 可 以 对 它 的 各 个 字段 进行 解释 ， 因 为 所 有 的 指令 都 是 定 长 
的 ， 且 长 度 相同 。 
FH. 
。 因 为 各 指令 需要 的 空间 其 实 是 不 一 样 的 (例如 单 操作 数 指令 和 多 操作 数 指令 相 比 )， 
这 可 能 会 造成 空间 的 浪费 . 
。 我 们 需要 一 些 连接 逻辑 (例如 译 码 希 和 多 路 选择 需 ) 来 将 指令 的 各 字段 分 配 到 数据 
通路 的 各 元 素 中 去 。 
。 指令 集 的 设计 者 受 限 于 所 有 指令 长 度 固定 (通常 是 一 个 字 ) 的 限制 。 这 种 限制 体现 
在 指令 中 立即 值 操作 数 的 大 小 以 及 寻 址 时 可 指定 的 偏 移 量 的 范围 。 
MIPS 就 是 使 用 定 长 指令 的 一 个 例子 。 
这 是 MIPS 的 一 些 指令 的 例子 : 


~<— § >< 5>=« 5j >e 5>=<«5->>-=-_§6—>> 


在 上 面 的 ADD 指令 中 ， 跟 在 Rd 后 的 $ 位 字段 是 没有 用 的 ， 但 因为 定 长 的 需求 只 能 保留 
下 来 。 [61 | 
。 指令 长 度 可 变 ”在 这 种 格式 中 指令 是 变 长 的 ， 即 一 条 指令 可 能 占 多 个 字 。 
。 优势 : 
。 不 会 有 空间 浪费 ， 因 为 每 条 指令 都 只 占据 了 它 所 需 的 空间 。 
。 指令 集 设 计 者 不 再 受 限 于 有 限 的 大 小 (例如 ， 立 即 值 的 大 小 )。 
。 有 机 会 根据 编译 器 对 指令 的 使 用 情况 ， 为 操作 码 、 寻 址 模式 、 操 作 数 选择 不 同 的 大 
小 和 编码 。 
o PIN, 
。 这 样 的 格式 使 实现 更 复杂 了 ， 因 为 指令 的 长 度 只 有 在 解释 了 操作 码 后 才能 确定 。 这 
会 导致 指令 的 操作 码 和 操作 数 需 要 顺序 解释 。 
DEC VAX 11 系列 和 Intel x86 系列 都 是 变 长 指令 体系 结构 的 例子 。 在 VAX 11 F, 指令 的 
长 度 在 1 ~ 53 字 节 变化 。 
需要 强调 的 是 ,我们 这 里 的 目的 并 非 暗 示 说 本 节 介 绍 的 所 有 体系 结构 类 型 和 指令 格式 在 
今天 都 是 可 行 的 。 我 们 的 目的 是 让 读者 了 解 在 指令 集 设 计 上 有 过 许多 曾经 党 试 过 的 选择 。 例 
如 ， 过 去 曾经 有 过 商业 化 的 面向 栈 的 体系 结构 (使 用 零 操 作 数 格式 ) 和 基于 累加 器 的 机 器 (使 
用 单 操作 数 指令 格式 )。 然 而 ， 这 些 体系 结构 已 经 不 再 是 通用 处 理 豆 的 主流 。 
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210 LC-2200 指令 


我 们 定义 LC-2200 作为 这 个 简单 体系 结构 的 一 个 具体 例子 。 这 是 一 个 面向 寄存 器 的 、 小 
端的 、 使 用 定 长 指令 格式 的 体系 结构 。 有 16 个 通用 寄存 器 以 及 一 个 单独 的 程序 计数 器 (PC). 
所 有 的 地 址 都 是 字 地 址 。 介 绍 这 个 指令 集 的 目的 有 3 +: 

e LC-2200 作为 一 个 简单 的 指令 集 的 具体 实例 能 够 满足 任何 高 级 语言 的 需求 。 

。 CERTE 3 HAE 5 曹 讨论 实现 细节 的 有 具体 体系 结构 。 

。 更 重要 的 是 ，LC-2200 作为 一 个 简单 的 、 没 有 阻碍 的 工具 ， 用 来 让 我 们 在 讨论 中 给 它 添 

加 一 些 其 他 的 特性 ， 比 如 后 面 草 市 中 的 中 断 、 虚 拟 内 存 和 同步 。 这 种 增加 功能 对 于 一 
个 学 习 工 具 来 说 是 非常 有 吸引 力 的 ， 因 为 它 能 引导 读者 走 过 根 据 某 种 需求 给 处 理 需 增 
加 某 些 特性 的 整个 过 程 。 


2.10.4 令 格 式 


LC-2200 支持 4 种 指令 格式 。R 型 指令 包含 add 和 nand。I 型 指令 包含 addi,lw,sw 和 beq。 
J 型 指令 包括 jalr。O 型 指令 包括 halt。 因 此 ，LC-2200 共有 8 条 指令 。 表 2-1 总 结 了 这 些 指 令 
的 语义 。 

R 型 指令 (add, nand ): 

28 ~ 31 位 : 操作 码 

24 ~ 27 位 : reg X 

20 ~ 23 fii: reg Y 

4 ~ 19 位 : 未 使 用 (应 为 全 0 ) 

0~3 位 : regZ 
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| 型 指令 (addi, lw, sw, beq): 

28 ~ 31 位 : 操作 码 

24 ~ 27 位: reg X 

20 ~ 23 位 : reg Y 

0 ~ 19 位 : 立即 值 或 地 址 偏 移 量 ( 20 位 的 用 补 码 表示 的 数 ， 范围 从 -524 288 ~ 524 287) 


31 2827 2423 2019 0 


(有 符号 的 ) 立即 数 或 地 址 偏 移 量 





J 型 指令 (jalr) 9: 

28 ~ 31 位 : 操作 码 

24 ~ 27 位: reg X( 跳 转 目 标 ) 
20 ~ 23 位 : reg Y (BEXATAR) 
0 ~ 19 位: 未 使 用 (应 为 全 0 ) 


© LC-2200 并 没有 单独 的 无 条 件 跳 转 指令 ， 然 而 我 们 可 以 通过 JALR Rino Raoncare 来 实现 无 条 件 跳 转 ; 这 里 的 
R,， 包 含 目 的 地 址 而 Rs。 是 一 个 你 不 关心 其 当前 值 的 寄存 器 。 
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表 2-1 LC-2200 指令 


例子 用 寄存 器 传输 语言 表达 的 动作 


add 0 将 寄存 器 Y 的 内 容 与 寄存 器 Z 的 内 容 相 加 ， 结 果 存 到 寄存 器 XX 
add $v0,$a0,$al [> ton | 中 RTL: $v0 +— $a0 + $al 

nand l 将 寄存 器 Y 的 内 容 与 寄存 器 Z 的 内 容 做 与 非 ， 结 果 存 到 寄存 器 X 
nand $v0,$a0.$al EA oo | 中 RTL:$v0 <— ($a0 && $al) 

addi 2 KHAT ak Y 的 内 容 与 立即 值 相 加 ， 结 果 存 到 寄存 需 X 中 

addi $v0,$a0,25 0010, RTL:$v0 +— $a0+25 


lw 3 从 内 存 中 取 值 到 寄存 器 X， 内 存 地 址 为 OFFSET 与 寄存 器 Y 的 
lw $v0,042($fp) 0011, 内 容 之 和 
RTL:$v0 «- MEM[$fp +0x42] 
sw 4 Karar X (FAT FE, Abh OFFSET 与 寄存 器 YY 的 
sw $a0,042($fp) 0100, 内 容 之 和 
RTL:MEM[$fp +0x42] +— $a0 
beq 5 LE EE T FF e K AA Ar Y 的 值 。 如 果 相 同 ， 则 转移 到 地 址 
beq $a0,$al.done 0101, PC+I+OFFSET, PC 是 当前 beq 指令 的 地 址 
RTL:if($a0 ==$al) PC + PC+1+OFFSET 


注意 ， 从 程序 员 方 便 (及 实现 者 麻烦 ) 的 角度 来 说 ， 汇 编 器 根据 指令 给 出 的 值 或 符号 以 及 汇编 器 自己 对 PC 的 理解 
= OFFSET {fi- -— 一 一 done-(PC+1) 存在 OFFSET 中 ， 所 以 机 器 能 够 在 运行 时 跳 转 到 “done” = 
首先 将 PCH 存 人 寄存 右 Y 中 ， 此 处 的 PC 是 jalr 指令 的 地 址 。 然 
z $at,$ra 0110, a 信义 所 保存 的 地 址 。 注 意 ， 如 果 久 和 YY pagal 

， 那 么 处 理 器 首先 将 PCH 存 人 寄存 器 ， 因 此 会 转移 到 PC+1 

RTL: $ra «— PC + 1; PC <— $at 
注意 ， 无 条 件 跳 转 能 够 通过 指令 jalr Sra, $t0 并 舍弃 $t0 的 值 来 
as 这 就 是 为 什 么 在 LC-2200 中 没有 单独 的 跳 转 指令 

no 实际 上 是 一 条 伪 指令 ( 即 汇编 器 会 产生 下 面 的 指令 : add $zero, 


= $zero ) 


halt 
halt 0111， 


O 型 指令 (中 断 ) 
28 ~ 31 位 : 操作 码 
0 ~ 27 位 : 未 使 用 (应 为 全 0) 


31 28 0 


操作 码 未 使 用 


2.10.2 LC-2200 寄存 器 组 


正如 前 面 所 说 ，LC-2200 有 16 个 程序 员 可 见 的 寄存 器 。 事 实证 明 ， 在 编译 高 级 语言 时 ， 
0 是 个 非常 有 用 的 小 的 整 型 数 。 比 如 ， 它 常用 来 初始 化 程序 变量 。 因 为 如 此 ， 我 们 决定 让 寄 
存 器 RO 一 直 保 持 0 值 。 写 到 RO 的 操作 会 被 体系 结构 自动 忽略 掉 。 
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我 们 为 这 16 个 寄存 带 起 了 便于 记忆 的 名 字 ， 同 时 与 2.8.3 节 中 描述 的 软件 oe 
AMM, PSS ae ee, FR CEA Ea FT ABI S$ 符号 。 寄 存 器 、 助 记名 、 预 


期 的 作用 以 及 软件 惯例 总 结 如 表 2-2 PPAR 


表 2-2 寄存 器 惯例 





ante Ba 是 否 由 被 调用 者 保存 
ET na. 
6 i No 
9 要 保存 的 寄存 Yes 


要 保存 的 寄存 器 Yes 
- ca Achat Yes 
No 
No 





fA 
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2.11 影响 处 理 器 设计 的 问题 


2.11.1 指令 集 

在 本 章 中 ， 我 们 一直 把 注意 力 集中 在 指令 集 设计 上 面 。 我 们 对 指令 集 首先 关心 的 是 能 够 
将 高 级 语言 结构 编译 为 有 效 的 机 如 个 。 这 种 关心 在 某 些 角 度 上 是 正确 且 有 意义 的 。 然 而 ， 这 
并 不 是 Intel 或 AMD 这 类 公司 的 体系 结构 工程 师 通 消 达 旦 所 挂念 的 事情 。 事实 上 ， 在 20 世纪 
80 年 代 和 90 年 代 出 现 了 许多 ISA， 虽然 它们 的 优雅 程度 不 一 ,但 都 是 由 我 们 前 面 讨论 的 问 
题 驱动 的 。 从 优雅 和 性 能 的 角度 来 说 ，Digital Equipment Corporation (DEC) 的 Alpha 体系 结 
构 是 最 好 的 体系 结构 之 一 。DEC Alpha 的 体系 结构 工程 师 对 编译 器 生成 代码 的 直观 性 和 有 效 
性 以 及 ISA 的 设计 如 何 能 有 效 实现 进行 了 大 量 的 思考 。 随 着 DEC 公司 这 个 20 世纪 80 年 代 和 
90 年 代 的 微型 计算 机 先锋 的 死去 ，Alpha 体系 结构 也 走 到 了 尽头 。 

20 世纪 80 年 代 出 现 了 复杂 指令 集 计算 机 ( Complex Instruction Set Computers, CISC) 和 
精简 指令 集 计 算 机 ( Reduced Instruction Set Computer, RISC) 之 间 的 争论 。 使 用 CISC ™ ISA, 
编译 器 作者 的 任务 就 会 变 得 更 复杂 ， 因 为 将 高 级 语言 结构 编译 为 机 络 码 有 太 多 的 选择 。 除 此 
之 外 ，ISA 的 复杂 性 对 于 硬件 的 有 效 实 现 也 是 个 巨大 的 挑战 。 对 于 编译 需 作 者 来 说 ， 有 选择 
大 体 上 是 好 事 ， 但 如 果 程 序 员 不 懂得 性 能 通常 需要 优先 考虑 的 话 ， 那 这 些 选 择 就 有 问题 了 。 
随 着 编译 器 技术 的 日 渐 成 熟 ， 有 人 认为 RISC 型 的 ISA HE CISC 型 的 ISA 更 加 易于 编译 器 作 
者 使 用 ， 同 时 也 能 更 有 效 地 实现 。 

我 们 都 知道 , Intel 的 x86 是 一 个 经 得 住 时 间 考 验 的 ISA， 它 是 一 个 CISC 型 的 ISA。 HAT, 
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x86 还 是 占 主 导 地 位 的 ISA。 与 此 同时 ， 许 多 更 优雅 的 指令 集 ， 如 DEC Alpha， 已 经 消失 了 。 
原因 在 于 决定 指令 集成 败 的 其 他 因素 有 很 多 (市 场 压 力 8 是 主要 因素 )。 性 能 因素 当然 是 很 重 
要 的 考量 ,但 真正 好 的 指令 集 ， 如 Alpha， 它 们 相对 于 x86 的 性 能 优势 还 没有 大 到 让 它们 成 
为 主导 者 。 另外 ， 尽 管 x86 指令 集 的 硬件 实现 很 有 挑战 性 , 但 Intel 和 AMD 聪明 的 体系 结构 
工程 师 已 经 做 出 了 有 效 的 实现 ， 由 于 它 在 时 钟 频率 上 很 占 优 ， 因 此 一 个 “好 的 ”指令 集 的 性 
能 优势 并 不 大 ， 至 少 没有 足够 大 来 取代 已 经 占据 市 场 的 指令 集 如 x86. 

究 其 根本 ， 一 个 指令 集 的 成 败 很 大 依赖 于 市 场 对 它 的 接纳 程度 。 今 天 计算 机 软件 支持 着 
从 商业 到 娱乐 的 一 切 。 因此， 主要 的 软件 商 (CU Microsoft, Google, IBM 和 Apple) 对 指令 
集 的 接纳 程度 成 了 决定 指令 集成 败 的 关键 因素 。 另 一 个 同等 重要 的 因素 是 计算 机 制造 商 (如 
Dell, HP. Apple Al IBM) 对 采用 这 种 指令 集 的 处 理 需 的 接纳 程度 。 除 了 传统 的 市 场 (笔记 本 、 
REER A), MARRA (例如 游戏 机 、 手 机 、 掌 上 电脑 和 汽车 ) 也 成 了 计算 机 领域 
中 的 重要 部 分 。 很 难 精确 地 描述 为 什么 某 个 指令 被 或 不 被 这 些 软件 巨头 、 计 算 机 制造 商 和 艇 
入 式 系 统 开 发 者 接纳 。 尽 管 我 们 趋 癌 于 认为 这 是 由 指令 集 的 优雅 程度 决定 的 ， 但 是 从 计算 机 
的 历史 上 上 看， 并非 如 此 。 这 些 决定 通常 是 依据 语 用 学 pragmatic 做 出 的 ， 即 是 和 否 有 针对 该 ISA 
的 好 的 编译 需 可 用 (尤其 是 C 语言 )， 是否 支持 遗留 代码 ， 等 等 。 


2.11.2 ”应 用 程序 对 指令 集 设计 的 影响 


应 用 程序 在 过 去 影响 着 指令 集 的 设计 , 今后 还 会 继续 影响 。 在 20 世纪 70 年 代 ， 甚 至 
到 20 世纪 80 年 代 早 期 ,计算 机 主要 用 于 处理 数字 的 科学 和 工程 应 用 程序 。 这 些 应 用 非常 依 
赖 于 浮 点 算术 。 高 端 计算 机 (如 IBM 370 系列 机 和 Cray) 在 指令 集中 包含 了 这 些 指 令 ， 而 
当时 所 谓 的 小 型 机 (如 DEC PDP 11 系列 ) 则 没有 包含 这 些 指令 。 兽 经 有 成 功 的 公司 (如 
Floating Point Systems 公司 ) 制作 附加 的 处 理 帮 用 于 为 小 型 机 提供 浮 点 运算 加 速 。 如 今 ， 浮 
点 指令 已 经 是 任何 通用 处 理 右 的 一 部 分 了 。 用 于 舱 入 式 应 用 如 手机 和 掌上 电脑 的 处 理 恬 (如 
StrongARM, ARM) 可 能 没有 这 些 指 令 ， 它们 通过 数学 库 使 用 整数 指令 来 实现 浮 点 运算 。 

另 一 个 应 用 程序 影响 指令 集 设计 的 例子 是 Intel 的 MMX 指令 。 有 的 应 用 程序 专门 处 理 音 
频 、 视 频 、 图 像 这 样 的 流 数据 ， 即 像 电 影 和 音乐 这 样 的 连续 数据 。 这 些 数据 在 内 存 中 通常 表 
现 为 数组 。MMX 指令 由 Intel 公司 于 1997 年 在 奔腾 系列 处 理 需 中 首先 引入 ， 目 标 是 让 CPU 
能 够 高 效 处 理 流 数 据 。 这 套 指令 背后 是 很 简单 的 直觉 。 正 如 流 数据 这 个 名 称 所 暗示 的 ， 音 频 、 
视频 和 图 像 应 用 需要 在 两 个 或 多 个 流 相 应 的 数据 上 进行 相同 的 操作 (比如 加 法 )。 所以， 应 该 
有 指令 去 模仿 这 种 行为 。MMX 指令 最 初 是 在 奔腾 处 理 需 中 引入 的 ， 奔 腾 的 后 继 型 号 也 继承 
了 它 。 一 共有 57 条 指令 ， 分 成 算 本 、 逻 辑 、 比 较 、 转 换 、 移 位 和 数据 传输 ， 每 个 指令 都 有 两 
个 操作 数 (不 是 标量 ， 而 是 许多 元 素 构 成 的 回 量 )。 比 如 ， 一 个 加 指令 会 把 两 个 回 量 中 对 应 位 
置 的 元 素 相 加 。 有 

一 个 更 近 的 例子 来 自 于 游戏 产业 界 。 交 互 式 的 游戏 已 经 变 得 非常 复杂 。 实 时 游戏 控制 端 
的 图 像 和 动画 处 理 需 求 已 经 超出 了 通用 处 理 器 的 处 理 能 力 。 当 然 ， 你 下 次 假期 旅行 时 不 可 能 
拖 着 一 台 超 级 计算 机 去 玩 游戏 ! 于 是 出 现 了 图 像 处 理 单元 (GPU)， 这 是 专用 的 外 接 处 理 器 ， 


怠 “ 市 场 压 力 的 一 部 分 是 必须 支持 遗留 代码 ， 即 那些 在 同类 处 理 器 的 老 版 本 上 开发 的 软件 。 这 种 处 理 器 的 向 后 
兼容 性 为 Intel x86 ISA 的 辉煌 做 出 了 巨大 贡献 。 

© HEE., MMX 指令 从 一 种 称 为 单 指令 多 数据 (SIMD) 的 并 行 体系 结构 进化 而 来 ，20 世纪 90 年 代 中 期 以 前 
这 种 体系 结构 非常 流行 ， 用 于 满足 图 像 处 理应 用 的 需求 。 参 见 第 12 章 中 对 不 同 并 行 体 系 结构 类 型 的 介绍 。 
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用 于 完成 游戏 控制 端 所 需 的 算术 运算 。 基 本 上 ，GPU 包含 了 许多 功能 单元 (SC Ri Ye 
用 所 需 的 基本 操作 ) 来 并 行 处 理 流 数据 。 最近 Sony, IBM 和 Toshiba 的 合作 项 目 公 开 了 Cell 
处 理 右 ， 进 一 步 发 展 了 GPU 的 概念 。Cell 处 理 需 在 一 块 芯片 上 集成 了 几 个 处 理 元 素 ， 每 个 都 
能 被 编程 以 完成 特定 的 任务 。Cell 处 理 需 体系 结构 已 经 应 用 于 PlayStation(PS3) 中 。 


2.11.3 ”其 他 驱动 处 理 怖 设计 的 问题 


外 令 集 设计 只 是 现代 处理 器 设计 中 的 问题 之 一 ， 其 至 不 是 最 引 人 关 注 的 问题 。 这 里 列 出 
了 更 多 重要 的 问题 ， 其 中 的 一 些 将 在 后 面 的 章节 中 详细 阐述 。 

1 ) 操作 系统 ”我们 提 到 过 ， 操 作 系 统 在 处 理 需 设计 中 扮演 着 重要 的 角色 。 它 的 一 个 表现 
是 ,系统 给 程序 员 造 成 一 种 假象 ， 让 内 存 空间 看 起 来 比 实 际 内 存 容量 大 得 多 。 男 一 个 表现 是 
处 理 需 对 中 断 等 外 部 事件 的 啊 应 能 力 。 在 后 面 的 章节 我 们 将 看 到 ， 为 了 满足 操作 系统 的 需求 ， 
处 理 带 需要 包含 一 些 新 的 指令 ， 以 及 一 些 从 指令 集 层面 看 不 出 来 的 体系 结构 的 新 机 制 .。 

2 ) 对 现代 语言 的 支持 ”大 多 数 现代 语言 如 Java, C++ 和 CH 都 向 程序 员 提 供 了 动态 增长 
和 缩小 程序 的 能 力 。 这 称 为 动态 内 存 分 配 ， 这 个 特性 从 应 用 开发 程序 员 和 操作 系统 资源 管理 
的 角度 来 说 都 非常 有 力 。 当 数据 尺寸 缩小 的 时 候 恢 复 内 存 ， 即 垃圾 回收 机 制 ， 是 资源 管理 的 
关键 。 处 理 需 体系 结构 中 目 动 回收 垃圾 的 机 制 是 当今 处 理 器 设计 中 的 一 个 热点 。 

3) 存储 系统 如 你 所 知 ， 处 理 需 的 速度 在 过 去 十 年 中 按照 接近 指数 的 规律 增长 着 。 例 
如 ，1986 年 ， 一 台 Sun 3/50 拥有 一 颗 0.5 MHz 的 处 理 器 ; 2007 年 ， 笔 记 本 和 桌面 电脑 拥有 
超过 2 GHz 的 处 理 硕 。 内 存 的 密度 也 按 指数 增长 着 ， 但 内 存 的 速度 却 跟 不 上 处 理 器 的 增长 速 
度 。 处 理 硕 和 内 存 速 度 的 这 种 不 一 致 被 称 为 内 存 墙 。 在 处 理 器 设计 中 ， 使 用 聪明 的 技术 来 越 
过 这 道内 存 墙 是 最 重要 的 问题 之 一 。 例 如 ， 设 计 高 速 缓存 并 将 它 集 成 到 处 理 器 中 就 是 这 类 技 
本 。 我 们 在 后 面 的 存储 需 层 次 音节 中 会 包括 这 些 内 容 。 

4 ) FATE ” 随 着 心 乒 密 度 的 提高 ， 单 块 硅 片 上 稼 名 可 以 集成 数 以 百 万 计 的 晶体 管 ， 这 使 
得 在 单个 处 理 兰 上 能 够 放置 更 多 的 功能 单元 - 实际 上 ， 世 片 的 密度 已 经 达到 可 以 在 同一 块 硅 
片上 放置 多 个 处 理 器 的 高 度 。 这 种 称 为 多 核 和 众 核 的 体系 结构 ， 带 来 了 一 系列 全 新 的 处 理 器 
设计 的 问题 ?其 中 的 一 些 问题 ， 例 如 并 行 编程 和 内 存 一 致 性 问题 ， 是 从 传统 的 多 处 理 器 机 器 
(含有 多 个 处 理 需 的 计算 机 ) 上 搬 过 来 的 ， 我 们 在 后 面 中 会 讨论 它们 。 

5) 调试 ”程序 变 得 复杂 了 。 类似 于 Web 服务 融 这 样 的 应 用 ， 除 了 并 行 和 拥有 极 大 的 内 
存 印迹 之 外 ， 可 能 还 包含 接触 网 络 和 数据 库 的 组 件 。 写 这 样 的 程序 自然 很 不 简单 。 现 代 处 理 
催 设 计 的 一 个 重点 就 是 有 效 地 支持 调试 ， 尤 其 是 并 行程 序 。 

6) 虚拟 化 ” 随 着 应 用 程序 复杂 性 的 增加 ， 它 们 的 需求 也 越 来 越 复 杂 了 。 例 如 ， 一 个 应 用 
可 能 用 到 某 些 服务 ， 而 这 些 服务 只 存在 于 某 些 特定 的 操作 系统 中 。 如 果 你 要 同时 运行 多 个 程 
序 ， 而 每 个 程序 又 有 各 目的 需求 ,那么 就 需要 文 持 同时 存在 多 个 应 用 执行 环境 。 由 于 某 些 原 
因 ， 你 可 能 会 在 笔记 本 上 闻 双 系统 。 如 果 能 够 让 多 个 操作 系统 共存 ， 且 不 需要 来 回 切换 的 话 
就 好 了 。 虚 拟 化 是 这 样 一 个 系统 概念 ， 在 同一 个 计算 机 系统 上 支持 多 个 不 同 的 运行 环境 。 体 
系 机 构 工 程 师 们 开始 注意 如 何在 现代 处 理 需 设计 中 有 效 地 文 持 这 个 概念 。 

7) 容错 性 ” 随 着 硬件 体系 结构 变 得 更 加 复杂 ， 有 了 多 核 与 众 核 以 及 庞大 的 层次 存储 系统 
之 后 ， 部 件 出 错 的 可 能 性 增加 了 。 体系 结构 工程 师 们 现在 更 加 注意 设计 让 处 理 需 对 程序 员 隐 


日 ”在 体系 结构 上 说 ， 多 核 和 众 核 之 间 并 没有 很 大 区 别 。 但 是 编程 范 型 需要 彻底 地 考虑 它 是 否 具有 比 少数 几 个 
(8 或 16) 更 多 的 核 。 因此， 它们 的 区 别 就 是 ， 多 核 有 不 超过 8 或 16 个 核 ， 比 这 更 多 的 就 是 众 核 了 。 





RB BRRBA 47 


He IX HE FS WC BZ AK 


Wy RSI A. 事实 证 明 即 使 在 计算 机 内 部 〈 在 内 存 系统 和 CPU 之 间 ) 也 会 出 现 安全 


8 ) 安全 性 ”在 这 个 时 代 ， 计 算 机 的 安全 是 个 大 问题 。 当 提 到 保护 计算 机 安全 的 时 候 ， 通 


问题 。 体 系 结构 工程 师 们 试图 在 处 理 右 和 内 存 的 通信 中 采用 加 密 技术 来 缓解 这 类 问题 。 


小 结 


和 令 集 是 硬件 和 软件 之 间 的 契约 。 在 本 章 中 ,我 们 从 基础 开始 讲解 了 指令 集 设 计 中 的 问 


题 。 需 要 记 住 的 重要 内 容 总 结 如 下 : 


。 在 塑造 ISA 时 高 级 语言 结构 的 影响 。 

。 编译 算术 /逻辑 运算 、 条 件 语 句 、 循 环 和 过 程 调 用 需要 ISA 提供 的 最 低 支持 。 
。 影响 ISA 对 寄存 需 使 用 的 一 些 实际 问题 (如 寻 址 和 访问 时 间 ) < 

© ISA 中 与 高 效 编译 高 级 语言 结构 的 需求 相称 的 取得 内 存 操作 数 的 寻 址 模式 。 
。 处 理 胡 使 用 有 限 寄存 融资 源 的 软件 惯例 。 

© 软件 栈 的 概念 及 其 在 编译 过 程 调用 中 的 使 用 .， 

。 最 小 的 ISA 的 一 些 可 能 的 扩展 . 

。 当今 影响 处 理 器 设计 的 其 他 重要 问题 。 


练习 题 
1. 有 人 认为 ， 处 理 器 拥有 大 的 寄存 器 文件 对 性 能 是 有 害 的 ， 因 为 在 高 级 语言 的 过 程 调用 /返回 中 会 有 更 


2. 
.在 LC-2200 指令 集中 ， 加 法 指令 的 操作 数 在 什么 地 方 ? 
. 这 个 问题 和 字 节 序 有 关 。 你 现在 要 写 一 个 比较 字符 串 的 程序 。 你 可 以 选择 使 用 32 位 字 节 寻 址 的 大 端 


A Ww 


A 


ON 


N 


oo 


ae 


大 的 开销 。 你 同意 这 种 看 法 吗 ? 给 出 你 的 理由 
请 写 出 栈 指针 和 帧 指针 之 间 的 区 别 。 


或 小 端 体系 结构 来 实现 。 在 这 种 情况 下 ， 你 会 将 4 个 字符 打包 到 一 个 字 中 。 你 的 选择 是 什么 ,程序 又 
该 如 何 写 呢 ? (提示 : 通常 情况 下 字符 串 是 一 个 个 字符 进行 比较 ， 如 采 能 够 一 个 个 字 地 进行 比较 ， 那 
速度 就 会 快 很 多 。) 


ISA 可 能 会 支持 多 种 形式 的 条 件 分 支 指令 ， 比 如 BZ (为 去 时 分 支 )、BN (为 负 时 分 文 )、BEQ (相等 时 


分 支 )， 请 指出 哪 一 种 形式 最 适合 于 让 语句 中 的 哪 种 谓词 表达 式 ， 给 出 几 个 让 语句 中 谓词 表达 式 的 例 
子 ， 并 说 明 在 这 些 不 同 风 格 的 条 件 分 支 指令 下 ， 如 何 编译 这 些 条 件 语句 。 


. 我 们 说 过 ， 字 节 序 不 影响 程序 的 性 能 和 正确 性 ， 前 提 是 (高 级 ) 数据 结构 的 使 用 方式 和 声明 中 的 一 致 。 


有 没有 这 样 的 情况 ， 即 使 你 遵守 了 上 面 的 规则 ， 仍 然 会 遭受 字 节 序 的 影响 呢 ? (提示 : 考虑 跨 网 络 边界 
的 程序 ,) 


. 使 用 汇编 具体 实现 C 语言 的 switch 语句 ， 用 跳 转 表 和 任意 形式 的 条 件 分 支 指令 。 (提示 : 先 确 认 变 量 


值 在 switch 变量 的 合法 范围 内 .然后 跳 转 到 当前 值 对 应 代码 段 的 起 始 地 址 ,执行 ， 跳 到 退出 )。 


.过 程 A 在 S 寄 存 器 组 和 T 寄 存 器 组 中 都 保 在 有 重要 数据 ， 当 A 调用 过 程 B 时 ，A 需要 将 哪些 寄存 顺 


保存 到 栈 中 ?哪些 寄存 右 由 B 来 保存 ? 
考虑 过 程 调用 执行 时 栈 的 使 用 。 是 否 所 有 在 栈 上 的 操作 都 仅 发 生 在 栈 项 (通过 push 和 pop) ? 给 出 一 
此 在 程序 执行 中 访问 栈 内 部 的 情况 、 并 解释 这 是 如 何 发 生 的 


10. 判断 下 面 这 句 话 是 否 正确 : 若 没 有 帧 指针 ， 则 过 程 调用 /返回 无 法 实现 . 
11. DEC VAX 有 一 个 单条 指 今 可 以 将 所 有 程序 可 见 的 寄存 器 从 内 存 中 加 载 或 保存 到 内 存 中 。 你 能 说 出 一 


个 使 用 这 一 对 指令 的 原因 吗 ” 有 什么 好 处 和 坏处 ? 


AL 


EA 


12, 
13. 


14, 
t3. 
16. 
17. 
18. 


20. 


2 


o 


如 何 使 用 已 有 的 LC-2200 ISA 来 模拟 一 条 减法 指令 。 

BEQ 指令 限制 了 你 从 PC 的 当前 位 置 转移 到 目标 的 距离 。 如 果 你 的 程序 需要 跳 转 的 距离 超出 了 BEQ 
指令 中 偶 移 量 的 范围 ， 你 该 如 何 使 用 已 有 的 LC-2200 ISA 来 实现 这 样 的 长 跳 转 呢 ? 

ISA 是 什么 ， 它 为 什么 很 重要 ? 

指令 集 设 计 都 受到 哪些 因素 影响 ? 

条 件 语句 是 什么 7 ISA 如 何 处 理 它们 ? 

给 寻 址 模式 下 个 定义 。 

在 2.8 节 中 ,我 们 提 到 过 程 的 局 部 变量 是 在 栈 上 分 配 的 。 这 种 描述 有 利于 简化 我 们 的 阐述 ， 但 现代 
的 编译 器 并 不 是 这 样 做 的 。 上 网 找 找 看 现代 编译 器 是 如 何 为 过 程 的 局 部 变量 分 配 空间 的 。( 提 示 : 强 
调 一 下 寄存 器 比 内 存 要 快 。 所 以 目标 应 该 是 将 尽 可 能 多 的 变量 放 在 寄存 器 中 。) 


.我 们 提 到 栈 时 使 用 了 术语 “抽象 ” 。 这 个 术语 是 什么 意思 7“ 抽象 ”暗含 着 它 是 如 何 实 现 的 吗 ? 例如， 

过 程 调用 /返回 时 使 用 的 栈 是 硬件 实现 还 是 软件 实现 ? 

给 出 如 下 指令 : 

BEQ Rx, Ry, offset ; if (Rx == Ry) PC = PC+offset 

SUB  Rx,Ry, Rz ; Rx < Ry — Rz 

ADDI Rx, Ry, [mm ; Rx <— Ry + Immediate value 

AND Rx,Ry, Rz ; Rx — Ry AND Rz 

你 该 如 何 实现 下 面 指令 的 功能 : 

BGT _ Rx, Ry, offset : if (Rx > Ry) PC = PC+olfset 

假设 寄存 融和 立即 数字 段 都 是 8 EE, AMR PST UTS rtd AT AEE MY at E o 
.给 出 下 面 的 加 载 指 令 


LW Rx, Ry, OFFSET ; Rx <— MEM[Ry + OFFSET] 

如 何 实现 一 种 新 的 寻 址 模式 ， 称 为 间接 寻 址 模式 ， 用 汇编 语言 表示 如 下 : 

LW Rx, @(Ry) ; 

这 条 指令 的 语义 是 寄存 器 Ry 的 值 是 一 个 指针 的 内 存 地 址 ， 而 这 个 指针 指向 的 内 存 操作 数 需 要 装 入 Rx 中 。 


22. 将 语句 


23. 


24. 


g = h + Afi]; 

转化 为 LC-2200 iatt, (Bat A 的 地 址 在 $t0 中 , g 在 $sl 中, h 在 $s2 中, i 在 $tl 中 。 

假设 你 设计 了 一 台 计 算 机 ， 名 为 “大 循环 2000”"， 它 从 不 进行 过 程 调 用 ， 在 运行 到 末尾 时 会 自动 跳 
回 到 内 存 的 起 始 位 置 。 这 时 还 需要 程序 计数 融 么 ? 给 出 你 的 理由 。 

某 个 处 理 需 满足 下 面 的 假设 : 

。 所 有 的 参数 通过 栈 进行 传递 。 

。 寄 存 器 V0 用 于 返回 值 。 

。 寄 存 器 组 S 预期 是 被 保存 的 ， 即 ， 调 用 者 不 需 做 任何 事情 ， 在 过 程 调用 后 S 的 值 应 该 与 调用 前 一 样 。 
。 寄存 器 组 T 预期 是 临时 使 用 的 ， 即 ， 在 调用 了 子 过 程 之 后 ,，T 中 的 值 可 能 就 变 了 。 
考虑 下 面 的 程序 


int bar(int a, int b) 


{ 
/* 使 用 寄存 器 T5，T6，S11-S13 的 代码 */ 
return(1); 
} 
int foo(int a, int b, int. €, int d; int e) 
{ 
ant XZ, Y3 
/* 使 用 寄存 器 T5-t10，S11-S13 的 代码 */ 
bar(x, y); /* 调用 bar */ 
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/* 司 用 寄存 器 TE HEK a, b、c 的 代码 */ 
return(0); 

} 

main(int argc, char **argv) 

{ 
int Pr Gs E; By Ëp Ug 
/* 使 用 T5 ~ T10 和 S11 ~ S15 的 代码 */ 
foo(p, q, Er S, t); /* 调用 foo * / 
/* 使 用 寄存 器 T9,T10 的 代码 */ 

} 

下 面 是 在 bar 执行 时 的 栈 ， 请 标明 栈 中 的 每 一 项 是 在 哪个 过 程 保存 的 。 

main foo bar 
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A, IBM 又 推出 了 IBM 370 系列 [IBM system/370, 1978]. 360 和 370 系列 机 是 CISC 型 ISA 设计 的 案 
例 。 在 计算 机 的 演化 中 另 一 个 有 影响 力 的 公司 是 数字 设备 公司 (DEC) [Bell Web Page, 2010]. DEC 的 
PDP-8 是 20 世纪 60 年 代 出 现 的 12 位 机 器 。 它 的 指令 集 都 基于 处 理 器 中 仅 有 的 一 个 寄存 句 ， 即 累加 大 
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[PDP-8, 1973]. DEC 的 PDP-11 是 PDP-8 的 16 位 后 继 者 ， 主 导 了 20 世纪 70 年 代 ~ 90 年 代 的 小 型 机 
市 场 。PDP-11 的 ISA 是 围绕 8 个 寄存 需 做 的 [Bell, 1970]. DEC 在 20 世纪 70 年 代 中 后 期 推出 了 VAX 
11 体系 结构 ， 作 为 中 端 计算 机 应 用 的 一 种 32 位 的 选择 [Strecker，1978]。 它 是 经 典 的 CISC 型 体系 结构 . 

20 世纪 80 年 代 出 现 了 RISC 类 型 的 体系 结构 。William Joy 是 Sun Microsystem 的 共同 创始 人 之 一 ， 
他 写 了 一 篇 有 意思 的 文章 9S 记 录 了 RISC 的 演化 。 在 1980 年 ，David Patterson 教授 启动 了 Berkeley RISC 
项 目 [Patterson，1981]， 这 后 来 成 了 Sun Microsystem 的 SPARC 体系 结构 的 基础 [SPARC Architecture, 
2010]. MIPS 在 20 世纪 80 年 代 早 期 作为 Stanford 的 一 个 校园 项 目 出 现 。 这 个 项 目的 领导 者 John 
Hennessy 教授 ,在 1984 年 创建 了 MIPS Computer Systems 公司 。 这 个 公司 后 来 被 Silicon Graphics (SGI) 
收购 。 

IBM 801[Cocke，2000 ; Radin, 1982] 在 20 世纪 70 年 代 末 作为 一 个 实验 项 目 出 现 ， 领 导 者 是 John 

Cocke, {il IBM 的 一 个 计算 机 先驱 和 图 灵 奖 得 主 。 在 20 世纪 80 年 代 ， 这 个 项 目 中 的 许多 想法 出 现 

在 IBM 的 商业 产品 POWER 体系 结构 中 。 由 Apple、IBM 和 Motorola 组 成 的 联盟 将 POWER 体系 结 
构 推 广 到 了 PC 中 。 这 一 系列 的 处 理 器 ， 称 为 PowerPC， 用 于 Apple 的 Mac 中 ， 直 到 2006 年 。HP 在 
20 世纪 80 年 代 中 期 也 发 明了 自己 的 RISC 体系 结构 Precision 体系 结构 ， 或 称 PA-RISC[Mahon, 
1986]. HP 的 工作 站 都 使 用 这 种 体系 结构 ， 直 到 2008 年 。Alpha 处 理 器 是 64 位 的 RISC 体系 结构 ， 出 
自 DEC[Sites，1992]。 尽管 这 种 体系 结构 很 有 意思 、 实 现 也 很 新 奇 ， 但 由 于 非 技术 的 原因 (公司 并 购 ) 
而 退出 了 市场。 

Intel 的 80x86 体系 结构 出 现 于 20 世纪 80 年 代 ， 至 今 仍 在 市 场 中 占 主 导 地 位 。 它 是 CISC 型 的 体系 
结构 。 了 解 x86 指令 集 细 闻 最 好 的 办 法 就 是 从 源头 开始 [Intel Instruction set, 2008]. 

[Patterson, 2008] 教材 是 理解 计算 机 基本 组 成 和 设计 的 极 佳 来 源 ， 尤 其 是 关于 本 章 的 主题 ， 即 指令 

集 设 计 以 及 编译 器 在 设计 中 起 的 引导 作用 部 分 。 
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上 一 章 探 讨 了 处 理 器 中 的 指令 集体 系 结构 设计 的 问题 。 本 章 探讨 的 问题 是 ， 有 了 指令 集 
之 后 ， 处 理 融 的 实现 。 指 令 集 并 没有 描述 处 理 咒 如 何 实现 ， 它 只 是 硬件 和 软件 之 间 的 契约 . 
例如 ， 指 令 集 设计 好 后 ， 编 译 器 可 以 为 不 同 的 高 级 语言 生成 代码 ， 这 些 代 码 可 以 在 实现 这 个 
指令 集 的 处 理 右 上 执行 。 当 然 ， 我 们 对 于 同一 套 指 令 集 可 以 有 不 同 的 实现 。 在 本 章 中 我 们 将 
看 到 ， 有 许多 因素 会 影响 具体 选择 哪 种 实现 ， 


3.1 体系 结构 与 实现 


首先 我 们 要 理解 为 什么 要 区 分 体系 结构 和 实现 。 

1 ) 由 于 性 价 比 的 原因 ， 同 一 体系 结构 可 能 有 也 应 该 有 多 种 不 同 的 实现 以 满足 市 场 需 求 。 
例如 ， 在 服务 器 市 场 ( 例 如 ，Web 服务 器 ) 应 该 有 高 性 能 的 处 理 器 ， 与 此 同时 ， 租 人 式 系统 
(如 打印 机 ) 中 则 需要 处 理 需 的 低 端 版 本 。 这 就 是 为 什么 会 有 遵循 同一 种 体系 结构 的 处 理 器 家 
族 ， 其 中 有 些 甚 至 直接 就 叫做 某 个 系列 (如 Intel Xeon 系列 、IBM 360 系列 、DEC PDP-11 系 
列 等 )。 

2 ) 另 一 个 去 除 体 系 结构 与 实现 之 间 耦 合 的 重要 原因 是 ， 系 统 软件 和 硬件 可 以 并 行 部 署 。 
例如 ， 通 过 去 耦合 ， 使 得 我 们 可 以 验证 针对 某 种 新 体系 结构 的 系统 软件 (WSR PERE. VaR AE 
操作 系统 )， 即 使 这 种 体系 结构 还 没有 可 用 的 实现 。 这 极 大 地 减少 了 推出 一 套 计算 机 系统 所 需 
的 时 间 。 

3 ) 高 性 能 服务 需 的 客户 在 软件 上 做 出 了 巨大 的 投入 。 例 如 ，Oracle 数据 库 是 一 套 庞大 而 
复杂 的 数据 库 系 统 。 与 处 理 需 更 新 换代 相 比 ， 这 类 软件 系统 的 进化 非常 缓慢 。Intel 的 合作 创 
tA A Gordon Moore 在 1965 年 预测 ， 单 位 面积 上 的 品 体 管 数量 每 两 年 翻 一 番 。 实 际 上 ， 技 术 
进步 的 速度 要 更 快 一 些 ， 处 理 器 的 速度 每 18 个 月 翻 一 番 。 这 意味 着 每 18 SAMAA— KE 
快 的 处 理 硕 冲击 市 场 。 如 果 你 注意 过 每 年 新 出 的 处 理 需 的 速度 ， 就 会 明显 感觉 到 这 一 点 。 软 
件 的 改变 则 比 硬件 技术 慢 得 多 。 因 此 ， 遗 留 软件 能 在 新 版 本 的 处 理 器 上 运行 是 很 重要 的 。 我 
们 应 该 维持 契约 ( 即 指令 集 ) 稳定 ， 以 便 大 部 分 的 软件 (如 编译 器 及 相关 工具 ,还 有 调 优 后 的 
应 用 程序 ) 在 处 理 需 的 换代 过 程 中 基本 保持 不 变 。 体 系 结构 与 实现 的 非 耦 合 特性 使 保持 传统 
软件 的 二 进 制 兼容 性 得 以 满足 。 


3.2 ”处 理 怖 实现 涉及 什么 


实现 一 个 处 理 器 需要 考虑 以 下 一 些 因素 : 价格 、 性 能 、 功 耗 、 散 热 、 操 作 环 境 等 。 例 如 ， 
用 于 军事 的 处 理 器 需要 更 加 坚固 的 实现 以 抵抗 恶劣 多 变 的 环境 。 用 于 笔记 本 的 同样 的 处 理 带 
则 不 需要 这 么 坚固 的 实现 。 

处 理 器 的 实现 主要 有 两 个 方面 需要 关注 。 

1 ) 第 一 个 关心 的 问题 是 电子 部 件 ( ALU、 总 线 、 寄 存 带 等 ) 的 组 成 如 何 满足 处 理 噩 的 性 
能 价格 定位 。 
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2) 第 二 个 关心 的 问题 与 热学 和 机 械 问题 有 关 。 包括 散热 以 及 在 印刷 电路 板 (通常 称 为 主 
板 ) 上 放置 处 理 硕 的 物理 儿 何 学 等 。 

这 两 个 问题 是 与 单 芯 片 处 理 硕 相关 的 。 当 然 ， 计 算 机 中 的 硬件 不 仅仅 是 一 个 处 理 器 。 还 
有 许多 其 他 问题 需要 整体 考虑 ， 包 括 印 刷 电 路 板 、 背 板 、 连 接 器 、 底 盘 设 计 等 。 总 的 来 说 ， 
计算 机 系统 设计 是 多 方面 的 一 种 权衡 。 如 果 我 们 只 考虑 高 端 市 场 (超级 计算 机 、 服 务 器 、 台 
式 机 )， 那 么 大 概 就 是 性 能 与 价格 的 权衡 。 然 而 ， 对 于 手机 这 样 的 艇 入 式 系 统 来 说 ， 功 耗 
( power consumption)、 性 能 ( performance)、 面 积 (area) 这 三 者 的 结合 GH PRA PPA) 才 是 
设计 中 的 主导 原则 。 


超级 计算 机 服务 器 台式 机 和 个 人 计算 机 | = AE | 


高 性 能 是 主要 的 目标 中 等 的 性 能 和 价格 廉价 是 主要 的 目标 小 尺寸 、 低 功 耗 和 性 能 都 是 主要 目标 





原则 上 ， 计 算 机 设计 是 一 种 依 徘 经 验 的 工作 ， 在 多 个 维度 上 进行 权衡 就 像 猜 这 一 样 。 

本 和 草 中 ,我 们 着 眼 于 处 理 需 实现 。 尤 其 是 ， 处 理 融 的 数据 通路 和 控制 。 本 章 中 的 设计 是 
一 个 基础 版 本 。 在 第 5 章 中 ， 我 们 会 探索 流水 线 处 理 融 的 实现 。 

现在 我 们 复习 逻辑 设计 课程 中 可 能 已 经 讲 过 的 一 些 重要 的 便 件 概 念 。 


3.3 重要 的 硬件 概念 


3.3.1 电路 


组 合 逻 辑 ”这 种 逻辑 电路 的 输出 是 输入 的 布尔 组 合 。 也 就 是 说 ， 这 里 没有 状态 ( 即 记 忆 ) 
的 概念 。 这 种 电路 由 基本 的 逻辑 门 CAND, OR, NOT, NOR, NAND) 组 成 。 另 一 种 认识 这 
类 电路 的 方式 是 ， 它 们 没有 从 输入 回 到 输入 的 反馈 。 

考虑 一 个 混合 了 许多 麦克 风 的 输入 并 给 扬 声 需 产生 一 个 复合 输出 的 捅 线 板 。 扬 声 句 的 输 
出 取决 于 接线 板 选择 的 麦克 风 以 便 产 生 复 合 声音 。 这 个 接线 板 就 是 一 种 组 合 逻 辑 电路 的 例子 。 
在 处 理 器 的 数据 通路 中 能 发 现 的 组 合 逻 辑 电 路 包括 多 路 复 用 器 、 解 复 用 希 、 编 码 带 、 解 码 硕 
和 算术 / 逻辑 单元 。 

时 序 逻 辑 ”时序 逻 辑 电 路 的 输出 是 当前 输入 与 当前 状态 的 布尔 组 合 。 除 了 组 成 组 合 逻 得 
电路 的 那些 基本 的 逻辑 门 外 ， 组 成 时 序 逻 辑 电 路 还 需要 一 种 称 为 触发 器 的 记忆 元 件 作为 关键 
部 分 。 

考虑 一 个 车 库 门 开关 控制 电路 。 这 个 电路 的 输入 就 是 一 个 按钮 以 及 一 些 表示 门 开 看 还 是 
关 着 的 开关 。 电 路 的 输出 是 一 个 控制 电机 升 高 或 降低 车 库 门 的 信号 。 动 作 的 方向 取决 于 门 的 
当前 状态 。 因 此 ， 车 库 开 关门 控制 器 是 一 个 时 序 逻 辑 电路 。 处 理 需 数据 通路 中 的 寄存 项 和 内 
存 也 是 时 序 逻 辑 电路 的 例子 。 


3.3.2 ”数据 通路 的 硬件 资源 


处 理 器 的 数据 通路 包含 了 组 合 导 辑 与 时 序 逻 辑 元 件 。 根 据 第 2 章 中 给 出 的 LC-2200 指令 
集 ， 我 们 来 确定 数据 通路 需要 哪些 资源 。 

我 们 需要 内 存 来 保存 指令 和 操作 数 。 我 们 需要 算术 /逻辑 单元 (ALU) 来 执行 算术 /逻辑 
指令 。 我 们 需要 寄存 器 堆 ， 因 为 它 是 大 部 分 指令 集体 系 结构 中 操作 的 重点 。 绝 大 部 分 指令 使 
用 寄存 器 堆 。 我 们 需要 程序 计数 器 (以 后 简称 为 PC) 来 指向 当前 指令 以 及 用 于 实现 第 2 EP 
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讨论 过 的 分 文 跳 转 指令 。 当 一 条 指令 从 内 存 中 取出 后 ， 它 需要 存储 在 数据 通路 的 某 个 地 方 ， 
所 以 我 们 引入 了 指令 寄存 器 OR) 来 保存 指令 . 

顾名思义 ， 寄 存 器 推 就 是 体系 结构 中 程序 员 可 见 的 寄存 器 的 集合 。 我 们 需要 控制 线路 和 
数据 线路 来 操作 寄存 器 推 。 这 包括 用 来 寻找 某 一 特定 寄存 器 的 地 址 线 以 及 读 / 写 寄 存 需 的 数 
据 线 。 只 人 允许 同时 读 单 个 寄存 需 的 寄存 需 堆 称 为 单 端口 寄存 器 堆 (SPRF )。 人 允许 同时 读 两 个 寄 
存 器 的 寄存 器 堆 ， 称 为 双 端 口 寄 存 器 堆 (DPRF)。 例 3-1 给 出 了 寄存 器 堆 所 需 的 所 有 控制 线 和 


证 号 线 。 


URAS 下 图 是 一 个 双 端 口 寄存 器 堆 (DPRF)， 包 含 64 个 寄存 器 。 每 个 寄存 器 32 Ko Asares 和 Baares 
是 端口 A 和 端口 B 所 读 寄 存 器 的 地 址 。Cosress 是 数据 Data_in 写 入 的 寄存 器 的 地 址 。RegWrEn 是 寄存 器 
推 的 写 使 能 信和 号。 图 中 的 每 个 箭头 各 有 几 根 线 ? 


Daia_in 







A address Caddress 


Win A AF AF a HE 
(DPRF) 


Baddress 64 X 32-bit RegWrEn 





Dout 





Dout 


Sig O A 端口 8 
答 : 

a. Data in 有 32 根 线 。 

b. 39 0 A 有 32 RH. 

c. 端口 B 有 32 RR. 

d. Ansdress 有 6 根 线 。 

e. Bares 有 6 根 线 ， 

f. Coaaress 有 6 根 线 。 

g. RegWrEn 有 1 根 线 。 


3.3.3 边沿 触发 逻辑 


寄存 器 内 容 从 当前 状态 改变 到 新 状态 是 对 时 钟 信号 的 响 输入 
Ww (ULRI 3-1 )。 

输入 变化 引起 输出 变化 的 具体 时 间 取 决 于 这 个 元 件 是 电 
平 逻 辑 9 还 是 边沿 触发 逻辑 。 在 电 平 轴 辑 中 ， 只 要 时 钟 信号 是 。 ”四 外 
高 电 平 ， 那 么 变化 就 会 发 生 。 而 在 边沿 触发 逻辑 ( 见 图 3-2 ) 
中 ， 变 化 只 会 发 生 在 时 钟 的 上 升 沿 或 下 降 沿 。 如 果 状 态 变 化 


发 生 在 上 升 沿 ， 则 称 为 正 边沿 触发 逻辑 ;如果 变化 发 生 在 下 Rm 
降 沿 ， 则 称 为 负 边 沿 触 发 逻辑 . 图 3-1 寄存 器 。 只 在 响应 时 钟 
信号 时 输出 才 会 变化 


O “习惯 上 将 使 用 电 平 逻 辑 的 存储 器 件 称 为 锁 存 器 。 寄 存 器 则 通常 用 于 指 边沿 触发 的 存储 器 件 : 
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上 升 沿 。” 下降 沿 
图 3-2 时钟。 时钟 周 期 指 的 是 两 个 连续 的 上 升 沿 (或 下 降 沿 ) 之 间 的 时 间 间 隔 
在 后 面 的 讨论 中 ,我 们 假设 数据 通路 中 所 有 的 寄存 器 都 使 用 正 边沿 触发 逻辑 。 我 们 将 在 
3.4.2 节 中 讨论 选择 时 钟 周期 宽度 的 细节 
寄存 器 A、B 和 C 连接 成 了 下 面 的 电路 ; 


LdA LdB LdC 初始 状态 
A = 98 


B = 765 
C = 432 





ldA、1dB 和 IdC 是 寄存 器 A、B 和 C 的 时 钟 信 号 。 如 果 在 某 个 时 钟 周 期 内 A、B、C 的 值 如 图 中 所 示 ， 
那么 下 一 个 时 钟 周 期 它们 的 值 又 是 什么 ? 
ae 


各 个 寄存 器 的 输入 都 将 会 变 成 它们 的 输出 ， 因 此 ， 


A = 432; B = 98; C = 765 


内 存 元 件 比 较 特 殊 ( 见 图 3-3 )。 正 如 第 1 章 中 地 址 ”数据 输入 
看 到 的 ， 在 讨论 计算 机 系统 组 成 时 ， 实 际 上 ， 内 存 
子 系统 是 完全 与 处 理 器 分 离 的 。 然 而 ， 出 于 简化 处 
理 需 实现 有 关 基 本 概念 的 目的 ,我 们 将 内 存 包 含 在 
数据 通路 设计 中 。 出 于 讨论 的 日 的 ， 我们 认为 内 存 读 / 写 
不 是 边沿 触发 的 。 内 存 
例如 ， 为 了 读 取 某 个 内 存单 元 ， 你 给 内 存 提供 
“地 址 ”和 “ 读 ” 信 号 ， 过 了 有 限 的 一 段 时 间 ( 称 为 
内 存 的 读 访 问 时 间 ) 后 ， 该 地 址 的 内 容 就 出 现在 “ 数 
据 输 出 ” 线 上 - 同样 ， 为 了 写 某 个 内 存单 元 ， 你 提 
供 “ 地 址 ”“ 数 据 输 入 ”， 以 及 “ 读 ” 信 号， 在 一 段 数据 输出 
有 限时 间 UMIRA 后 ， 该 内 存单 元 的 值 就 会 变 图 3.3 内存。 在读 操作 时 。 给 出 “地 址 ” 
成 通过 “数据 输入 ” 写 入 的 值 。 我 们 在 第 9 曹 中 会 _ 段 时 间 后 ， 指 定 的 内 存 内 容 就 
里 评 细 地 讨论 内 存 系统 。 会 在 “数据 输出 ” 线 上 出 现 
3.3.4 连接 数据 通路 元 件 
让 我 们 考虑 执行 LC-2200 指令 集中 的 ADD 指令 需要 什么 ， 并 由 此 推出 数据 通路 元 件 应 
该 如 何 连接 。 
1) 步骤 1: 我 们 需要 PC 来 指明 指令 在 何 处 ( 见 图 3-4 )。 
2) 步骤 2: 指令 从 内 存 中 读 出 后 ， 就 保存 到 IR 中 ( 见 图 3-5 ). 
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图 3-5 ”步骤 2。 指 令 从 内 存 中 读 出 后 ， 将 时 80 
图 3-4 步骤 1。PC 给 内 存 提供 了 指令 地 址 li eee Eee | 
钟 并 入 IR g2 


3) 步骤 3 : IR 中 的 指令 可 用 后 ， 就 可 以 使 用 (IR 中 的 ) 指令 中 给 出 的 寄存 器 号 从 寄存 器 
H (Mim, fil 3-1 中 的 类 似 ) 中 该 对 应 的 寄存 大。 使 用 ALU 进行 加 法 操作 ， 并 将 结果 写 
回 到 寄存 器 堆 中 对 应 的 寄存 需 ( 见 图 3-6 )， 





图 3-6 ”步骤 3。 执 行将 两 个 寄存 器 值 相 加 并 写 人 第 三 个 寄存 怖 中 83 | 


前 面 的 3 个 步骤 给 出 了 ADD 指令 执行 的 路 线 图 。 我 们 看 看 这 三 步 能 不 能 在 一 个 时 钟 周 期 
内 完成 。 前 面 提 到 ， 所 有 的 存储 元 件 (除了 内 存 外 ) 都 是 正 边沿 触发 的 。 这 意味 者 ， 在 一 个 时 
钟 周期 内 (如 果 相 对 于 逻辑 器 件 的 延迟 来 说 ， 时 钟 周期 足够 长 的 话 )， 我 们 能 将 信息 从 一 个 存 
储 元 件 传送 到 另 一 个 存储 元 件 (途中 经 过 组 合 逻 辑 和 内 存 )。 所 以 ， 步 又 1 和 步骤 2 可 以 在 一 
个 时 钟 周期 内 完成 。 但 步骤 3 不 能 在 同一 周期 内 完成 。 在 步骤 3 中 ， 我们 需要 从 IR 中 将 寄存 
fit HH (RIK A AE AEE. Eh F IR 的 边沿 


fk AEE. RL A BITS “SL FIO IR 
中 的 指令 才 可 用 ( 见 图 3-7 )。 


事实 证 明 ， 步骤 3 可 以 在 一 个 时 钟 周 期 ae Ea PRS 
内 完成 。 在 下 一 个 时 钟 周期 开始 时 ，IR 的 输 ”图 3-7 步骤 1 和 步骤 2( 第 一 个 时 钟 周 期 )。 两 
出 可 以 用 来 索引 需要 从 寄存 带 堆 中 读 出 的 具 个 步 又 都 是 在 一 个 时 钟 周期 内 完成 的 
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体 的 源 寄存 器 。 寄 存 器 值 读 出 后 ( 读 寄存 器 的 过 程 与 读 内 存 是 类 似 的 )， 将 它们 传递 给 ALU, 


执行 ADD 操作 ， 将 结果 写 和 人 目的 寄存 此 (由 


IR 给 出 )。 图 3-8 阐明 了 步骤 3 在 第 二 个 时 钟 | 
周期 内 的 完成 情况 . | 


决定 时 钟 周 期 ”我们 重新 审视 步骤 1 和 
步骤 2， 我 们 说 过 它们 可 以 在 一 个 时 钟 周期 内 
完成 。 要 完成 这 些 步 又 ， 时 钟 周 期 需要 多 长 
We? 根据 图 3-7， 从 第 一 个 上 升 沿 开始 ， 我 们 
可 以 枚 举 所 有 与 这 两 个 步骤 相关 的 组 合 迎 辑 的 延 壕 : 
。 等 待 PC 输出 稳定 到 可 以 读 取 的 时 间 (Dy cutpui-stabte) o 
© PC 输出 传播 到 内 存 地 址 输入 的 线 延迟 (DepcAaar)。 
。 读 取 指 定 地 址 单元 的 内 存 访问 时 间 CD mem-reaa) « 
。 内存 读 出 值 传播 到 IR 输入 的 线 延 返 ( Dicpouwiir)。 
。 在 第 二 个 时 钟 上 升 沿 前 ，IR 的 输出 需要 达到 稳定 ， 这 段 时 间 称 为 建立 时 间 (Ds,)。 
。 在 第 二 个 时 钟 上 升 沿 后 ，IR 输出 需要 保持 不 变 一 段 时 间 ， 这 称 为 保持 时 间 (D, nua)， 
完成 步骤 1 和 步骤 2 所 需要 的 时 钟 宽 度 必 须 大 于 上 述 延 到 的 总 和 : 
ETOP et BE > Dy cutpursabie + Dwire-pc-adar t Diem-reaa t Dyire-powr + Do + Deti 
我 们 对 每 个 时 钟 周 期 内 所 有 可 能 的 信号 传播 路 径 进行 分 析 。 然 后 ， 令 时 钟 宽 度 大 于 整 条 路 
径 的 最 坏 情况 下 信号 传播 延迟 - 在 3.4.2 节 中 ， 我 们 将 形式 化 定义 计算 时 钟 周期 涉及 的 术语 。 
给 出 下 面 的 参数 (单位 是 皮 秒 (ps))， 确 定 系统 所 需要 的 最 小 时 钟 宽 度 ( 仅 考虑 前 面 所 说 的 步 
又 1~3 ): 


<PC> 内存 >IR—-~<— regs > ALU > [reg 一 > 


图 3-8 步骤 3 (第 二 个 时 钟 周 期 )。ALU 的 结果 
在 第 二 个 时 钟 周 期 末 出 现在 寄存 震中 


ni (PC 输出 稳定 ) 20ps 
Dansons (从 PC 2 A A Ha dk ay 4 HERR ) 250ps 
D ivera-read (内 存 读 ) 1500ps 
D wire-Dout-Ik (从 内 存 数 据 输 出 到 IR by He HE GR ) 250ps 
Dei (IR 的 建立 时 间 ) 20ps 
Dinou CIR 的 保持 时 间 ) 20ps 
D wite-r-regite CMA IR 2| 3 FF 2 HE By Ae FEAR ) 250ps 
Dyegfite-read (寄存 器 扒 读 ) 500ps 
5 (从 寄存 器 推 到 ALU Ht A hy HER) 250ps 
Davu-or (执行 ALU 操作 的 时 间 ) 100ps 
Die ALu-reefite (从 ALU 输出 到 寄存 器 扒 的 线 延 座 ) 250ps 
Dycghite-wite ( 写 入 寄存 器 堆 的 时 间 ) 500ps 
答 : 


步骤 1 和 步骤 2 在 一 个 时 钟 周期 内 完成 。 这 两 个 步骤 需要 的 时 钟 宽度 是 
C Damp t Darre t Dm + Dinni TDi t Dow 2060ps 
步骤 3 占用 一 个 时 钟 周期 ， 所 以 所 需要 的 时 钟 宽度 为 
Cy> Diermeane 十 Duaneaa 十 了 wineneaiieALD + Datu-or + Dwire-auu-reghte t Dregfite-read> 1850ps 
最 小 时 钟 宽 度 > 最 坏 情 况 下 信号 传播 延迟 
>MAX(C,>, C3) 
>2060ps 
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例子 中 的 数据 是 相当 准确 的 数据 ( 2007 年 前 后 )。 从 例子 中 明显 可 以 看 出 线 延迟 占 主要 
地 位 。 


3.3.5 ”基于 总 线 的 设计 


为 了 执行 ADD 指令 ， 为 数据 通路 上 的 元 件 建立 了 专门 的 连接 。 为 了 实现 其 他 指令 (如 
LD)， 我 们 需要 建立 一 条 从 内 存 到 寄存 器 堆 的 路 径 。 以 此 类 推 ， 我 们 可 以 想象 数据 通路 上 的 
所 有 元 件 都 相互 连接 。 事 实证 明 ， 这 没有 必要 ， 也 不 是 正确 的 方法 。 我 们 检查 连接 ALU 到 寄 
存 希 堆 涉 及 什么 。 我 们 需要 与 位 宽 相应 数量 的 线路 来 连接 两 个 元 件 。 对 于 32 位 的 机 器 ， 需 要 
32 根 线 。 当 我 们 增加 数据 通路 元 件 的 连通 性 时 ， 需 要 的 线路 就 会 快速 增加 。 从 占用 硅 片 面积 
的 角度 来 说 ， 连 线 是 非常 昂贵 的 ， 所 以 我 们 需要 减少 连 线 数量 以 使 硅 片 真正 用 于 数据 通路 中 
活动 的 元 件 。 而 且 ， 仅 仅 增 加 线路 并 不 会 带 来 性 能 的 提高 。 例 如 ， 从 内 存 到 寄存 器 的 线路 对 
F ADD 指令 的 实现 一 点 帮助 都 没有 。 

所 以 ， 我 们 需要 更 加 细致 地 考虑 数据 通路 元 件 的 连接 问题 。 有 具体 来 说 ， 前 面 讨 论 给 我 们 
的 启发 是 ， 与 其 在 每 两 个 元 件 之 间 连 线 ， 不 如 设计 数据 通路 让 各 元 件 共 享 线路 。 让 我 们 来 研 
究 需 要 多 少 线 以 及 如 何 共 享 它们 . 

单 总 线 设计 最 极端 的 一 种 情况 是 ， 只 有 一 组 总 线 ， 所 有 的 元 件 都 共享 它 。 这 就 像 小 组 
开会 一 样 ， 一 个 人 说 ， 大 家 都 在 听 。 如 果 有 必要 参与 讨论 ， 每 个 人 都 会 轮 到 发 言 。 如 果 同 时 
有 多 人 讲话 ， 当 然 就 会 很 混乱 。 这 就 是 单 总 线 系统 (一 组 线路 被 所 有 元 件 共 享 ) 的 工作 方式 。 
图 3-9 就 是 这 样 一 个 系统 。 


I NAOT EOE ARAA ADDI ANARENEAEBBPEBOPBORLE DO ABEOBEES 
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图 3-9 ” 单 总 线 设计 。 仅 有 一 个 数据 通路 元 件 能 够 将 它 的 输出 放 到 总 线 上 ， 这 是 通过 相应 
的 “驱动 ”信号 来 实现 的 


总 线 说 明 这 组 线路 是 共享 。 第 一 点 需要 注意 的 是 ， 灰 线 是 一 条 电气 单 总 线 ， 也 就 是 说 ， 
总 线 上 的 数据 在 总 线 的 任意 一 段 都 是 可 用 的 。 第 二 点 需要 注意 的 是 ， 在 元 件 和 总 线 之 间 有 些 
三 角形 。 它 们 是 驱动 器 (也 称 为 三 态 缓冲 器 )。 每 个 元 件 需 要 连接 到 总 线 的 输出 上 ， 都 会 有 
这 样 一 个 驱动 器 。 它 们 将 数据 通路 元 件 和 总 线 进 行 电气 隅 离 。 所 以 ， 为 了 “连接 ”元 件 1 与 
总 线 ， 相 应 的 驱动 需 必 须 是 “ 开 ” 的 。 这 可 以 通过 选择 相应 的 “驱动 ”信号 来 完成 。 然 后 ， 
我 们 就 说 数据 通路 元 件 1 在 “驱动 ”总 线 。 同 时 存在 多 个 元 件 驱 动 总 线 是 错误 的 。 所 以 控制 
逻辑 的 设计 者 需要 保证 任意 一 个 时 钟 周 期 内 仅 有 一 个 驱动 硕 处 于 “ 开 ” 状 态 。 如 果 多 个 驱动 
器 同时 处 于 “ 开 ” 状 态 ， 那么 除了 总 线 上 的 值 变 得 无 法 预测 之 外 ， 还 可 能 对 电路 造成 致命 伤 
害 。 另 一 方面 ， 总 线 上 的 元 件 在 每 个 时 钟 周 期 都 会 尝试 获取 总 线 上 的 数据 。 为 此 ， 元 件 上 对 


日 ”一 个 二 进 制 信 号 通常 处 于 0 或 1 两 种 状态 中 。 而 驱动 器 的 输出 没有 被 使 能 时 则 是 第 三 种 状态 ， 不 是 0 也 不 
是 1， 是 一 种 称 为 高 阻 态 的 状态 ， 驱 动 器 将 总 线 与 元 件 在 电气 上 隔离 开 来 。 所 以 叫 作 三 态 缓冲 器 。 
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应 的 WrEn ( 写 使 能 ) 信号 必须 为 “ 开 ”。 

双 总 线 设计 图 3-10 展示 了 一 个 双 总 线 设 计 。 在 这 个 设计 中 ， 寄 存 器 是 双 端 口 的 ， 类 似 
于 例 3-1 中 的 那样 -: 因此 ， 在 一 个 时 钟 周期 内 可 以 同时 读 两 个 寄存 器 并 传送 给 ALU。 顶 部 的 
灰 线 和 底部 的 黑色 点 线 部 是 传输 地 址 和 数据 值 的 总 线 ， 上 有 具体 传输 的 内 容 取 决 于 在 这 个 时 钟 周 
期 内 需要 什么 。 然 而 ,在 名 义 上 ， 灰色 总 线 传 输 地 址 而 黑色 虚线 总 线 在 元 件 之 间 传 输 数 据 。 

里 然 图 中 没有 面 出 ,但 在 每 个 元 件 的 输出 端 部 有 驱动 带 连 接 到 总 线 上 。 完 成 3.3.4 节 中 的 
步骤 1 ~ 3 需要 几 个 时 钟 周期 呢 ? 每 个 周期 分 别 发 生 了 什么 呢 ? 

我 们 来 探讨 这 两 个 问题 





AY FF ae HE 
(DPRF) 





[m a ce ee ee et es me Oe os oe oud ae oe Se ee et wh nt ga Gt pa 


FF---------------~----— 


Oy 


广 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


图 3-10” 双 总 线 设计 。 目 的 是 让 元 件 之 间 两 个 独立 的 会 话 能 够 同时 进行 


第 一 个 时 钟 周 期 : 

。 从 PC 到 灰色 总 线 (注意 : 在 这 个 周期 内 没有 其 他 元 件 能 够 驱动 灰色 总 线 )。 

。 从 深 灰 色 总 线 到 内 存 地 址 。 

。 内存 读 取 Addr 指定 的 单元 。 

。 数据 从 Dout 到 黑色 虚线 总 线 (注意 : 此 时 没有 其 他 元 件 能 驱动 黑色 虚线 总 线 )。 
。 从 黑色 虚线 总 线 到 IR。 

。 时钟 触发 IR. 

我 们 在 一 个 时 钟 周 期 内 完成 了 步骤 1 和 步骤 2。 
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第 二 个 时 钟 周期 ， 

。 IR 将 寄存 大 号 提供 给 寄存 需 推 COL IR 到 寄存 器 堆 的 那个 箭头 ， 它 表示 对 应 的 线路 )， 
包括 两 个 源 寄存 器 和 一 个 目的 寄存 器 

。 读 寄存 器 推 ， 从 两 个 源 寄存 器 中 取出 数据 . 

。 寄存 器 堆 将 两 个 源 寄存 器 的 数据 值 提 供给 ALU ( 见 寄存 器 堆 到 ALU 的 箭头 表示 的 线路 )。 
。 执行 ALU 的 ADD 操作 . 

。 将 ALU 结果 提供 给 黑色 虚线 总 线 (注意 ， 这 个 时 钟 周期 内 没有 其 他 元 件 能 够 驱动 黑色 
虚线 总 线 ) 。 

。 从 黑色 虚线 总 线 到 寄存 器 堆 。 

e 根据 IR 给 出 的 目标 寄存 器 号 ， 写 人 寄存 融 堆 。 

在 这 个 时 钟 周期 内 我 们 完成 了 步骤 3 - 





前 面 讨论 中 最 关键 的 地 方 是 ,我 们 使 用 两 根 共 部 总线 (以 及 寄存 央 堆 到 ALU 的 连接 和 IR 
到 寄存 器 堆 的 选择 线路 ) 而 不 是 每 一 对 元 件 间 的 专 设 线路 完成 了 步骤 1 ~ 3. 


3.3.6 ”有 限 状态 机 


目前 为 止 ， 我 们 总 结 了 电路 元 件 以 及 它们 如 何 组 装 到 处 理 需 的 数据 通路 中 。 这 只 是 处 理 
器 设计 的 一 部 分 。 处 理 需 设计 中 同等 重要 的 一 部 分 是 控制 单元 。 最 好 将 控制 单元 理解 为 一 个 
有 限 状 态 机 (Finiut State Machine，FSM)， 因 为 将 数据 通路 通过 状态 切换 来 完成 指令 的 执行 。 

有 限 状 态 机 ， 顾 名 思 义 ， 有 有 限 个 状态 。 在 图 3-11 中 ,标记 为 S1、S2、S3 的 圆圈 是 
FSM 的 状态 。 箭 头 则 是 状态 之 间 的 转移 。FSM 是 任意 时 序 逻 辑 电 路 的 抽象 。 它 描述 了 电路 的 
行为 。FSM 的 状态 对 应 着 时 序 逻 辑 电 路 的 某 些 实际 的 物理 状态 。 描 述 一 个 转移 的 两 个 参数 是 : 
1) 触发 状态 发 生变 化 的 外 部 输入 ; 2 ) 电路 在 状态 转移 中 产生 的 输出 信号 。 因 此 ，FSM 描述 
实际 电路 所 有 硬件 细节 是 很 方便 的 。 

例如 ， 图 3-12 中 的 简单 FSM 就 表示 了 之 前 介绍 的 车 库 门 开关 控制 电路 。 表 3-1 给 出 了 这 
个 FSM 的 状态 转移 表 ， 包 括 导致 转移 的 输入 以 及 产生 的 相应 输出 。 

状态 “打开 ”表示 门 是 开 着 的 ， 而 “关闭 ”表示 门 是 关 着 的 。 输 入 是 一 个 遥控 需 按 钮 。 
输出 是 控制 马达 开关 门 的 信号 。 标 记 为 “0” 和 “1” 的 转移 表示 是 没有 按 下 按钮 的 情况 。 标 
记 为 “2” 和 “3” 的 转移 则 表示 按钮 被 按 下 。 转 移 “2” 产 生 一 个 控制 门 升 起 的 输出 信号 ， 而 
转移 “3” 产 生 一 个 使 门 降 下 的 信和 号。 学 过 逻辑 设计 课程 的 人 都 知道 ， 给 出 FSM 和 状态 转移 
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表 后 ， 设 计时 序 罗 辑 是 一 种 很 简单 的 练习 。( 见 本 章 未 尾 与 车 库 门 开关 控制 器 有 关 的 两 道 题 .) 


图 3-11 有 限 状 态 机 (FSM)。 圆 圈 表 示 状 态 ， 图 3-12 车 库 开 关门 控制 需 的 FSM。 各 个 转移 
箭头 表示 状态 转移 如 状态 转移 表 ( 见 表 3-1 ) 所 示 


表 3-1 图 3-12 中 FSM 的 状态 转移 表 
状态 
转移 号 当前 状态 下 一 状态 输出 
天 
无 
按 下 按钮 电机 往 上 拉 
电机 往 下 拉 


我 们 知道 时 序 逻 辑 可 以 是 同步 的 或 并 步 的 。 对 于 前 者 ， 状 态 转 移 是 与 时 钟 沿 同步 的 ， 而 
后 者 的 状态 转移 在 输入 变化 时 束 立 刻 发 生 . 

处 理 融 的 控制 单元 也 是 时 序 逻 辑 电路 -我 们 几 阅 3-13 中 的 FSM 表示 控制 单元 。 

yFETCH: 这 个 状态 表示 将 指令 从 内 存 中 到 山 


DECODE : 这 个 状态 表示 对 读 出 的 指令 进行 解释 以 (me (om 
确定 需要 什么 操作 数 以 及 做 什么 操作 ， 


EXECUTE: 这 个 状态 表示 执行 指令 。 
我 们 在 3.5 节 中 还 会 再 讲 到 控制 单元 . 


3.4 数据 通路 设计 


中 央 处 理 单元 (CPU) 包括 数据 通路 和 控制 单元 。 数 据 通路 拥有 所 有 的 逻辑 元 件 ， 而 控制 单元 
根据 处 理 吉 的 指令 集 为 数据 通路 提供 控制 信号-。 

数据 通路 是 人 硬件 资源 及 其 连接 的 结合 体 。 
我 们 看 看 数据 通路 需要 什么 硬件 资源 。 我 们 
提 到 过 ， 指 令 集 体系 结构 本 和 号 已 经 明确 选择 
了 一 些 硬件 资源 。 一 般 来 说 ， 除 了 指令 集 显 
式 要 求 的 之 外 ， 我 们 还 需要 更 多 的 硬件 资源 。 

为 了 使 讨论 更 具体 ， 我 们 先 给 出 LC-2200 
上 令 集 要 求 的 硬件 资源 : 

1 ) 能 够 进行 ADD、NAND、SUB 运算 图 3-14 单 输 出 端口 的 寄存 器 堆 - 4 位 的 “regno” 


0 
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图 3-13 控制 CPU 数据 通路 的 FSM 





的 ALU. 信和 号 唯一 确定 了 16 个 寄存 器 中 的 一 个 ; 
2) 包含 16 个 32 位 寄存 带 的 寄存 器 堆 ， “ WrREG ”信号 指定 了 对 该 寄存 器 进行 


如 图 3-14 所 示 。 读 操 作 还 是 写 操作 
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3) 32 位 的 PC. 

4) 2? « 32 位 字 的 内 存 . 

er 内 存 的 大 小 是 一 种 实现 上 的 
选择 。 体系 结构 只 是 通过 寻 址 能 力 限 制 内 存 空间 的 最 大 大 小 。LC-2200 具有 32 位 寻 址 能 力 ， 

所 以 最 大 的 内 存 空 间 应 该 是 eyes 而 每 个 字 为 32 位 。 

我 们 看 看 还 需要 什么 额外 的 硬件 资源 。 我们 提 到 过 ， 当 指令 从 内 存 中 读 出 后 ， 它 需要 保 
存在 数据 通路 的 某 个 地 方 。IR 正 是 用 于 此 目的 。 假 设 我 们 想 用 单条 总 线 将 所 有 这 些 元 件 连接 
起 来 ， 先 不 管 总 线 的 数量 ， 看 看 寄存 融 堆 就 能 发 现 很 明显 的 问题 。 我 们 只 能 从 寄存 器 堆 中 获 
得 一 个 寄存 器 的 值 ， 因 为 它 只 有 一 个 输出 端口 (Dout)。ALU 操作 需要 两 个 操作 数 。 所 以 ， 我 
们 和 需要 在 歼 问 通路 中 使 用 一 综 响 时 的 寄 了 存 需 来 保存 一 个 操作 数 。 而 且 ， 使 用 单 总 线 时 ， 所 有 
元 件 之 间 都 只 有 一 条 通道 。 这 就 是 我 们 将 寄存 右 A 和 B 放 在 ALU 前 面 的 原因 。 由 于 类 似 的 | ， 
原因 ， 我 们 需要 存放 ALU 给 出 的 内 存 地 址 。 于 是 出 现 了 内 存 地 址 寄存 器 (MAR). Z 寄存 器 |92 
(1 位 寄存 需 ) 的 作用 在 后 面 讨论 指令 集 实现 的 时 候 自 然 会 知道 。 在 Z 寄存 天 前 面 的 零 检 测 组 

合 逻 辑 (UL 3-15) 检测 总 线 上 的 值 是 否 为 0。 根据 指令 集 的 硬件 资源 、 数 据 通路 的 限制 以 及 
实现 指令 集 的 实际 需要 ， 我 们 最 终 得 出 了 一 个 单 总 线 设计 ， 如 图 3-15 所 示 。 
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LC-2200 数据 通路 
32 
LdIR R 
IR[31..0] 
IR[19..0] 
20 
F 
信和 号 
DrOFF yf 
IR[27..24] —— Rx: 传 给 控制 逻辑 的 4 位 寄存 器 号 
IR[23..20] 一 一 一 Ry: 人 人 和 
IR[3..0] -一 > Rz: 传 给 en 的 4 fea 
W= 2 IR[31..28] -一 > OP? nS Ps MZ AJ 4 位 操作 但 
1 Z: 传 给 控制 逻辑 的 1 位 布尔 值 
图 3-15” LC-2200 数据 通路 。 有 些 资源 是 由 ISA 指定 的 ， 另 一 些 则 是 由 于 单 总 线 的 限制 
而 加 上 去 的 


3.4.1 ISA 与 数据 通路 宽度 


我 们 将 LC-2200 定义 为 一 个 32 位 指令 集体 系 结构 。 因 此 ， 所 有 的 指令 、 地 址 和 操作 数 都 
是 32 位 的 。 我 们 现在 将 探讨 这 种 体系 结构 对 数据 通路 设计 带 来 的 影响 ， 理 解 对 总 线 和 ALU 
等 其 他 部 件 的 影 啊 。 

eieiei ee 来 说 ， 很 容易 ETE tn a 
如 ， 如 果 你 愿意 ， 你 可 以 使 用 1 位 加 法 器 来 实现 32 位 加 法 。 虽 然 这 会 很 慢 ， 但 确实 可 以 实 EX 
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同样 ， 你 可 以 让 图 3-15 中 的 总 线 变 得 比 32 位 罕 一 些 。 这 样 的 选择 会 影响 指令 的 执行 。 
比如 ， 如 果 你 使 用 了 8 位 宽 的 总 线 ， 那 么 你 需要 4 次 才能 从 内 存 中 读 出 一 条 指令 或 内 存 操作 
数 。 再 次 为 这 个 选择 付出 性 能 上 的 代价 。 

我 们 希望 使 用 比 ISA 要 求 更 低 精度 的 硬件 和 更 罕 的 总 线 ， 这 又 是 一 个 性 能 与 价格 权衡 的 
问题 。 因 为 大 部 分 芯片 面积 都 被 连接 线 占 据 了 ， 所 以 总 线 越 罕 ， 处 理 右 的 实现 就 越 廉价 。 使 
用 低 精 度 的 硬件 也 有 同样 效果 ， 因 为 它 会 减 小 数据 通路 中 连 线 的 宽度 。 

所 以 ， 数 据 通 路 的 设计 体现 出 性 能 价格 的 权衡 。 这 就 是 我 们 在 3.1 节 中 说 的 ， 芯 片 厂商 
会 提供 一 种 处 理 带 位 于 性 能 价格 曲线 上 不 同位 置 的 多 个 版 本 。 

为 了 我 们 的 讨论 ， 假 设 数据 通路 上 对 体系 结构 可 见 的 部 分 (PC、 寄 存 器 堆 、IR、 内 存 ) 
都 是 32 位 宽 。 

3.4.2 ”时 钟 脉冲 宽度 

在 3.3 节 中 ( 见 例 3-3 )， 我 们 非 形式 化 地 讨论 了 如 何 计算 时 钟 周 期 宽度 。 现 在 我 们 形式 化 
地 定义 与 时 钟 周 期 计算 有 关 的 术语 : 

。 每 个 组 合 逻 辑 元 件 (例如 ，ALU 或 图 3-15 中 的 驱动 门 ) 都 有 一 个 从 输入 到 输出 传播 值 

的 一 段 延迟 ， 这 称 为 传播 延迟 。 

。 类 似 地 ， 从 寄存 器 允许 读 取 (例如 ， 图 3-15 中 ， 将 regno 值 传送 到 寄存 需 堆 ) 到 将 内 容 

传送 到 输出 端口 (Dout) 也 有 一 段 延迟 ( 称 为 访问 时 间 )。 
。 对 于 要 写 人 寄存 器 的 情况 ， 输 入 到 寄存 需 在 时 钟 上 升 沿 到 来 之 前 一 段 时 间 要 保持 稳定 
( 即 输入 值 不 再 变化 )， 这 段 时 间 称 为 建立 时 间 。 

。 类 似 地 ， 在 时 钟 上 升 沿 到 来 之 后 ， 输 入 到 寄存 需 还 需要 保持 稳定 一 段 时 间 ， 这 称 为 保 
持 时 间 。 

。 最 后 ， 一 个 值 从 某 个 元 件 的 输出 通过 线路 出 现在 男 一 个 元 件 的 输入 (例如 ， 在 图 3-15 
中 从 驱动 门 的 输出 到 PC 的 输入 ) 的 这 段 时 间 称 为 传输 延迟 (也 称 为 线 延 迟 )。 

因此 ， 如 果 我 们 硕 望 在 一 个 时 钟 周 期 内 该 取 寄 存 硕 堆 中 的 某 个 全 并 将 它 放 和 人 寄存 需 A， 
我 们 需要 将 一 系列 的 延迟 相 加 。 我 们 计算 所 有 需要 在 单个 时 钟 周期 内 完成 的 数据 通路 操作 的 

94| 最 坏 情况 的 延迟 。 这 就 给 出 了 时 钟 周期 的 下 限 。 


3.4.3 ”检查 点 


到 目前 为 止 ， 我 们 回顾 了 下 面 的 便 件 概念 : 

。 基 本 的 逻辑 设计 ， 包 括 组 合 逻辑 电路 与 时 序 逻 辑 电 路 。 

。 数据 通路 中 的 硬件 资源 ， 如 寄存 句 堆 、ALU 和 内 存 。 

© 边沿 触发 逻辑 和 时 钟 周 期 宽度 。 

。 数据 通路 连接 和 总 线 。 

。 有 限 状态 机 ， 

我 们 使 用 这 些 概念 为 LC-2200 指令 集体 系 结构 建立 了 一 条 数据 通路 。 


3.5 ”控制 单元 设计 
如 图 3-16 所 示 。 管 弦 乐 队 指挥 的 作用 是 告诉 乐队 什么 时 候 谁 需要 演奏 或 演唱 。 乐 队 成 员 
自己 知道 自己 要 演奏 什么 ， 所 以 指挥 不 需要 管理 演奏 内 容 ， 只 需要 保持 节奏 和 次 序 就 可 以 了 。 
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如 果 说 数据 通路 是 乐队 ， 那 么 控制 单元 就 是 指挥 。 控 制 单元 为 数据 通路 中 的 元 件 完 成 自己 的 
工作 提供 一 些 提示 。 例 如 ， 如 果 DrALU 线 被 断言 ( 即 ， 如 果 线 上 值 为 1 )， 那 么 相应 的 驱动 器 
门 就 会 将 ALU 的 输出 放 到 总 线 上 . 





图 3-16 


每 个 成 员 给 出 “时 间 提 示 ” 


检查 数据 通路 后 ， 我 们 给 出 控制 单元 所 需要 的 控制 信号 : 

。 驱动 信号 : DrPC、DrALU 、DrREG 、DrMEM DrOFF. 

。 加 载 信号 : LdPC, LAA, LAB, LAMAR, 、LdIR LdZ. 

。 SAGES: WrMEM 

。 写 寄存 器 信号 : WrREG. 

。 ALU 功能 选择 器 : func 

。 寄存器 选择 : regno. 

如 何 产生 这 些 控制 信号 有 许多 可 能 的 实现 ， 所 有 的 实现 都 是 对 于 处 理 需 控制 单元 的 FSM 
的 便 件 实现 。 


3.5.1 ROM 加 状态 寄存 器 


我 们 来 看 一 个 非常 简单 的 设计 。 首 先 ， 我 们 需要 知道 处 理 右 处 于 什么 状态 。 前 面 我 们 介 
绍 了 控制 单元 的 FSM， 它 包含 FETCH ( 取 指 )、DECODE ( 译 码 ) Al EXECUTE (执行 ) 状态 。 
这 是 FSM 抽象 中 处 理 絮 宏 的 状态 。 在 真实 实现 中 ， 根 据 数 据 通 路 的 功能 ， 需 要 许多 微 状 态 来 
表示 宏 状 态 的 细节 。 例 如 ， 我 们 假设 需要 3 个 微 状 态 来 实现 FETCH 宏 状 态 。 我 们 将 这 些 为 微 
状态 进行 编码 : 


ifetchl 0000 
ifetch2 0001 
ifetch3 0010 


现在 我 们 引入 状态 寄存 器 ， 它 的 内 容 就 是 这 些微 状态 的 编码 。 所 以 ， 在 任何 情况 下 ， 这 
个 寄存 器 的 值 都 表示 人 处理 伦 的 状态 。 

状态 寄存 器 的 引入 让 我 们 又 从 FSM 抽象 向 硬件 实现 接近 了 一 步 。 下面 ， 为 了 在 每 个 微 状 
态 下 控制 数据 通路 的 各 个 元 件 ， 我们 需要 产生 之 前 列 出 的 控制 信号 。 下 面 我 们 来 讨论 如 何 才 
能 产生 这 些 控制 信号 。 
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一 种 最 简单 的 方法 是 ， 用 状态 寄存 器 作为 表 的 索引 。 表 中 的 每 一 项 都 包含 该 状态 所 需要 
的 全 部 控制 信号 。 用 前 面 的 乐队 做 比喻 ， 指 挥 面 前 有 整个 音乐 的 乐谱 。 在 演奏 曲子 时 ， 指 挥 
指导 管弦 乐队 的 演奏 。 指 挥 能 从 乐谱 的 每 一 行 中 看 出 ， 谁 应 该 在 哪 一 个 时 间 点 演奏 哪 一 个 音 
符 。 同 理 ， 我 们 能 从 控制 单元 表 的 表 项 看 出 ， 数 据 通路 的 元 件 在 这 个 状态 下 应 该 做 什么 。 每 
个 演奏 者 都 知道 日 己 逢 要 演奏 人 什么。 同样， 每 个 数据 通路 元 件 也 知道 自己 的 功能 。 两 者 的 相 
同 之 处 是 ， 他 们 都 需要 别人 ( 别 的 东西 ) 告诉 他 们 现在 该 做 什么 。 所 以 ,指挥 者 和 控制 单元 
有 者 极其 类 似 的 工作 ， 他 们 在 时 间 上 为 演奏 者 和 数据 通路 提供 了 必要 的 线索 (解决 了 “什么 
时 候 ” 的 问题 )， 使 其 能 够 在 正确 的 时 间 做 相应 的 事情 。 这 似乎 很 简单 ， 所 以 表 中 的 每 个 控制 
信号 用 1 位 表示 。 如 果 该 位 为 1， 则 表示 产生 该 控制 信号 ; 为 0， 则 不 产生 。 当 然 ，func 和 
regno 字段 的 位 数 与 它们 在 数据 通路 中 的 宽度 有 关 ( 见 图 3-15, 分 别 为 2 位 和 4 位 )。 图 3-17 
给 出 了 控制 信号 表 中 的 表 项 。 
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图 3-17 控制 信号 表 的 表 项 


控制 单元 需要 从 一 个 状态 转移 到 男 一 个 状态 。 例 如 ，FETCH 宏 状 态 需 要 3 个 微 状态 ， 那 
么 就 会 存在 下 面 的 情况 : 


当前 状态 下 一 状态 
ifetchl ifetch2 
ifetch2 ifetch3 


如 果 将 下 一 个 状态 也 写 在 表 中 ， 那 么 状态 转移 就 变 得 相对 简单 。 现 在 来 看 看 图 3-18 中 的 表 。 





驱动 信号 | 加 载 信号 


图 3-18 将 下 一 个 状态 加 入 控制 信号 表 中 






让 我 们 来 研究 如 在 硬件 上 实现 这 个 表 。 

这 个 表 其 实 就 是 存储 元 件 。 这 种 存储 元 件 的 特性 是 ,一旦 我 们 决定 了 某 个 状态 所 需要 的 
控制 信号 ， 该 表 项 的 内 容 就 被 冻结 。 我 们 称 这 种 存储 器 为 只 读 存 储 器 ， 或 ROM. 

所 以 ， 控 制 单元 的 硬件 实现 看 起 来 就 像 图 3-19 那样 。 在 每 过 一 个 时 钟 周 期 上 ， 状 态 寄 
存 器 就 转移 到 使 用 当前 时 钟 周 期 内 ROM 表 项 输出 指定 的 下 一 个 状态 。 这 是 驱动 数据 通路 中 
所 有 边沿 触发 存储 元 件 的 同一 个 时 钟 ( 见 图 3-15 )。 从 ROM 发 出 的 所 有 加 载 信号 (LdPC、 
LdMAR 等 ) 充当 时 钟 信号 的 掩 码 ， 决 定 它们 控制 的 存储 元 件 是 否 在 该 时 钟 周 期 内 被 驱动 。 

下 一 件 要 做 的 事情 就 是 将 数据 通路 和 控制 单元 结合 起 来 。 只 要 简单 地 将 数据 通路 〈 见 
图 3-15 ) 的 相应 命名 的 实体 与 对 应 的 ROM 输出 连接 起 来 。 
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DrPC, DrALU, DrREG, 
DrMEM, DrOFF 


LdPC, LdA, LdB, LAMAR, 
LdIR, Laz, WrREG, WrMEM 
func 


regno 





13-19 控制 单元 ， 使 用 状态 寄存 器 和 ROM. ROM 的 每 一 行 都 包含 了 当前 时 钟 周期 内 
需要 产生 供 数 据 通路 使 用 的 控制 信号 ( 即 “ 状 态 ”) 


控制 单元 的 工作 方式 如 下 : 

1 ) 状态 寄存 器 给 出 了 本 时 钟 周期 内 处 理 器 的 状态 。 

2) 通过 状态 寄存 需 的 值 对 ROM 进行 索引 访问 。 

3 ) ROM 的 输出 就 是 当前 传送 给 数据 通路 的 控制 信号 集合 。 

4 ) 在 本 时 钟 周 期 内 数据 通路 执行 控制 信号 指定 的 功能 。 

5 ) 将 ROM 给 出 的 下 一 状态 传送 给 状态 寄存 器 的 输入 ， 使 之 在 下 一 个 时 钟 周 期 开始 时 能 
够 转移 到 下 一 个 状态 。 

每 个 时 钟 周 期 都 重复 上 述 5 个 步骤 。 

图 3-13 将 处 理 器 的 控制 单元 描述 为 一 个 FSM。 为 了 方便 起 见 ， 我 们 再 将 它 画 在 图 3-20 
中 。 现 在 我 们 来 检查 图 3-20 中 的 每 个 宏 状态 需要 发 生 什么 ， 还 有 控制 单元 如 何 实现 它们 。 对 
于 每 个 微 状态 ， 我 们 在 旁边 标 出 了 数据 通路 的 操作 。 
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图 3-20 CPU 数据 通路 引进 的 FSM 


3.5.2 FETCH 宏 状 态 


FETCH 宏 状 态 从 程序 计数 器 (PC) 所 指出 的 内 存 中 取出 一 条 指令 到 指令 寄存 上 花 CIR) P, 
为 了 读 取 下 一 条 指令 ， 还 会 将 PC 递增 。 

现在 我 们 列 出 实现 FETCH 宏 状态 需要 做 什么 : 

。 将 PC 发 送 给 内 存 。 

。 读 出 内 存 的 内 容 。 

。 将 内 存 的 内 容 发 送 到 IR 中 。 
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。 递增 PC. 
很 明显 ， 如 果 使 用 单 总 线 数 据 通路 ， 那 么 这 些 步骤 无 法 在 一 个 时 钟 周 期 内 完成 。 


* ifetch] 
PC — MAR 


e ifetch2 
MEM[MAR] — IR 


¢ ifetch3 
PC >A 


。 ifetch4 
A + 1 — PC 
稍 加 思索 ， 我 们 就 能 在 少 于 4 个 时 钟 周期 内 完成 FETCH 宏 状 态 的 工作 。 观 察 在 ifetchl 
和 ifetch3 中 发 生 了 什么 。PC 的 内 容 传递 给 了 寄存 器 MAR 和 A。 这 两 个 状态 可 以 合并 为 一 个 
状态 ， 因 为 一 旦 PC 的 值 输出 到 总 线 上 ， 在 一 个 周期 内 这 两 个 寄存 器 都 可 以 取得 这 个 值 。 所 
以 ,我 们 可 以 将 上 面 的 序列 简化 为 : 
e ifetchl 


PC — MAR 
PC 一 > A 


+ ifetch2 

MEM[MAR| 一 IR 
* ifetch3 

A+1—>PC 


既然 我 们 已 经 知道 实现 FETCH 宏 状态 需要 数据 通路 在 每 个 微 状态 时 做 些 什么 ， 那么 可 以 
97 | 给 出 每 个 微 状 态 需要 的 控制 信号 。 对 于 每 个 微 状态 ,我们 将 用 到 的 数据 通路 元 件 和 控制 线 高 
9| 亮 表示 。 | 


* ifetchl 
PC — MAR 
PC 一 A 
所 需 的 控制 信号 : 
DrPC 
LdMAR 
LdA 


下 图 显示 了 ifetchl 微 状态 的 数据 通路 活动 。 


32 
LdPC LdA | B | LdMAR MAR | LAR 
32 : 

IR{31..0] 

WrREG WrMEM 
nie IR{19..0] 

4 204 
regno 





DPC- 7 Drau N7 DrREG -\ 7 DrMEM Ñ 7 DrOFF -\ 7 


e ifetch2 
MEM[MAR] — IR 
所 需 的 控制 信号 : 
DrMEM 
LdIR 
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下 图 显示 ifetch2 微 状态 的 数据 通路 活动 。 
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LdMAR MAR LdIR IR | 
32 


IR{31..0] 


LdPC LdA 


f 
re IR[19..0} 





DrPC \/ DrALU NZ = DrMEM \/ DrOFF 





注意 : 根据 数据 通路 的 设计 ， 对 内 存 的 默认 操作 为 读 操作 ( 即 WrMEM 为 0)。 而且， 内 
存 隐 式 地 读 出 了 MAR 指定 地 址 的 内 存 内 容 并 在 ifetch2 中 的 Dout 上 给 出 了 结果 。 


e ifetch3 
A +1l1— PC 
所 需 的 控制 信号 : 
func = 11 
DrALU 
LdPC 


下 图 显示 了 ifetch3 微 状 态 的 数据 通路 活动 。 
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LdPC LdA |B LdB LdMAR 





LdIR - 


IRi31..0] 
2 WrREG WrMEM 
func ALU: 
00: ADD IR[19..0] 
01: NAND 


10:A-B 
11:A + 1 regno 





DrPC WA DrALU \/ DrREG Wz DrMEM \/ 


注意 : 如 果 func 选择 的 信号 为 1， 那么 ALU 执行 的 操作 是 A+1 ( 见 图 3-15). 

现在 我 们 可 以 给 出 与 微 状 态 ifetchl 、ifetch2 ifetch3 对 应 的 ROM 的 内 容 ( 见 图 3-21，X 
表示 无 所 谓 )。ifetch3 的 下 一 状态 字段 临时 标记 为 TBD (To Be Determined, RRE), RRR 
们 会 讨论 这 个 字段 。 

这 开始 看 起 来 像 一 个 程序 了 ， 虽 然 它 比 我 们 第 一 节 编 程 课 上 讲 的 程序 要 低层 得 多 。 每 个 
ROM 单元 都 包含 驱动 数据 通路 不 同 元 件 工作 的 命令 集合 。 我 们 将 每 个 表 项 称 为 一 条 微 指 令 ， 
并 将 ROM 的 整个 内 容 称 为 一 个 微 程序 。 每 条 微 指 令 还 包含 下 一 条 要 执行 的 微 指令 的 地 址 。 
现在 ， 控 制 单元 的 设计 变 成 了 一 个 编程 练习 。 它 是 一 个 最 后 的 并 发 程序 ， 因 为 我 们 在 每 条 微 
指令 中 都 利用 了 硬件 的 并 行 性 。 
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装载 信号 cu a 


状态 


| © | 0 | xx [xox [00001 





图 3-21 一 些 填充 了 控制 信号 的 ROM 表 项 


注意 每 条 微 指令 都 是 有 结构 的 。 例 如 ， 所 有 的 驱动 信号 可 以 分 成 一 组 。 类 似 地 ， 所 有 加 
载 信号 也 可 以 分 成 一 组 。 这 样 的 设计 是 为 了 节约 表 的 空间 需求 。 例 如 ， 可 以 将 某 些 控制 信和 号 
结合 到 一 个 编码 字段 中 。 因 为 我 们 知道 任意 时 刻 在 总 线 上 只 有 一 个 实体 能 够 被 驱动 ， 所 以 我 
们 可 以 将 所 有 的 驱动 信号 集成 为 3 位 宽 的 字段 ， 这 个 字段 的 每 个 编码 都 唯一 指定 了 总 线 上 的 
一 个 应 该 被 驱动 的 实体 。 这 种 方法 在 减少 空间 占用 的 同时 ， 需 要 一 个 额外 的 解码 环节 ， 这 会 
增加 生成 控制 信号 的 延迟 。 我 们 无 法 将 所 有 加 载 信 号 都 集成 在 一 起 ， 因 为 可 能 会 有 多 个 存储 
元 件 在 同一 时 钟 周期 内 工作 。 


3.5.3 DECODE 宏 状 态 


一 旦 将 指令 取出 ， 就 准备 好 进行 解码 了 。 所 以 ,我 们 需要 从 ifetch3 微 状态 转移 到 
DECODE 宏 状态 。 

在 这 个 宏 状态 中 ， 我 们 检查 IR 的 内 容 (位 28 ~ 31) 以 识别 这 是 什么 指令 。 知 道 是 什么 
指令 后 ， 就 需要 找到 实现 这 个 指令 的 微 程 序 。 所 有 我 们 可 以 认为 DECODE (解码 ) 过 程 是 基 
于 指令 OPCODE (操作 码 ) 的 多 路 分 支 。 为 了 更 好 地 描述 解码 的 多 路 分 支 特性 ， 我 们 将 控制 
单元 的 FSM 重 绘 如 下 ( 见 图 3-22 )。 多 路 分 支 的 每 一 路 都 将 FSM 引 回 某 一 条 指令 的 具体 执 
行 ， 为 了 简单 起 见 ， 我 们 只 画 出 FSM 转移 到 不 同类 型 的 指令 。 





图 3-22 将 DECODE 宏 状态 展开 后 的 FSM 


很 快 我 们 将 回 到 如 何在 控制 单元 中 实现 多 路 分 支 的 问题 。 现 在 我 们 先 讨论 每 种 指令 的 一 
些 简单 实现 。 
3.5.4 EXECUTE 宏 状态 : ADD 指令 (R 型 指令 部 分 ) 

R 型 指令 具有 下 面 的 格式 : 


31 2827 2423 2019 


ADD 指令 执行 下 面 操作 : 





Ry < Ry + Rz 


为 了 实现 这 个 指令 ， RT BEA AF FF EE TS FF EER AB HT A RE 
需要 读 取 的 寄存 需 指 定 为 指令 的 一 部 分 ， 且 保存 在 IR 中 ， 在 数据 通路 中 是 可 用 的 。 然 而 ， 从 
数据 通路 中 可 以 看 到 ， 从 IR 到 寄存 带 堆 之 间 没 有 通路 。 这 个 “ 玲 忽 ” 是 有 原因 的 。 根 据 我 们 
要 读 或 写 的 寄存 器 ， 我 们 需要 将 IR 中 的 不 同 部 分 作为 寄存 器 堆 的 regno 输入 。 正 如 我 们 所 
见 ， 多 路 复 用 器 是 完成 这 类 选择 的 逻辑 元 件 。 

所 以 ， 我 们 需要 将 这 个 元 件 加 入 图 3-23 的 数据 通路 中 。 
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图 3-23 (EFA IR 位 字段 对 寄存 器 进行 选择 。 多 路 复 用 器 在 IR 中 选择 需要 发 送 给 寄存 器 
HE regno 地 址 的 专用 字段 


RegSel 控制 输入 (2 位 ) 来 自 于 微 指令 。 多 路 复 用 器 的 输入 是 IR 中 指明 寄存 需 的 3 个 字 
Be ( 见 第 2 章 中 LC-2200 指令 格式 )。 微 指令 从 不 直接 对 寄存 需 堆 寻 址 。 所 以 ， 我 们 在 微 指令 
中 用 2 位 RegSel 字段 来 代替 4 位 regno 字段 ( 见 图 3-24 )。 










C 








| OFF | PC MAR | PREG | func | TRegSel 下 一 
-一 全 


图 3-24 在 ROM 中 添加 了 RegSel 字段 


现在 我 们 写 出 实现 ADD 操作 宏 状态 的 微 状 态 的 数据 通路 活动 和 相应 的 控制 信号 。 


e addl 
Ry > A 
所 需 的 控制 信号 
RegSel = 01 
DrREG 
LdA 


下 图 显示 了 add1 微 状态 的 数据 通路 活动 。 
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LdPC | Pc | LdA ot | B| LdB LAMAR LdIR 


IR[31..0] 


WrREG WrMEM 


iR[19..0] 





DrPC AH DrALU Wi DrREG \/ DrMEM \/ 


注意 : 寄存 器 堆 的 默认 操作 是 将 regno faze Hh AY ay Fea AY AY Zee tH Fl Dout Eo 


* add2 
Rz—B 
所 需 的 控制 信号 : 
RegSel = 10 
DrREG 
LdB 
下 图 显示 了 add2 微 状 态 的 数据 通路 活动 。 
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LdPC LdA E -LdB | LdMAR 





LdIR 





IR[31..0] 
2 WrREG WrMEM 
ae IR[19..0] 
4 20 -| 
regno 





DrPC Xf DrALU SN DrREG \/ DrMEM \/ DrOFF \/ 


* add3 
A + B — Rx 
所 需 的 控制 信号 : 
func = 00 
DrALU 
RegSel = 00 
WrREG 


下 图 显示 了 add3 微 状态 的 数据 通路 活动 。 
ADD 宏 状 态 由 控制 单元 通过 将 add1、add2 、add3 微 状 态 串 联 起 来 实现 ， 最终 返 回 到 
FETCH ZIRA (ILA 3-25 )。 
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LdPC LdA E) LdB LdMAR LdIR 


IR[31..0] 
WrREG — WrMEM 


ae IR[19..0} 





regno 





DrPC DrALU -Ñ 7 DrREG \ 7 







返回 FETCH 


图 3-25 将 ADD 宏 状 态 展 开 之 后 的 FSM 


3.5.5 EXECUTE 宏 状态 : NAND 指令 (R 型 指令 部 分 ) 
NAND 指令 执行 如 下 操作 : 


Rx <— Ry NAND Rz 
NAND 宏 状 态 与 ADD 宏 状 态 的 相似 之 处 是 ， 有 nand1、nand2、nand3 三 个 微 状态 。 与 
ADD 相 比 ，NAND 的 三 个 微 状 态 有 哪些 不 同 ? 我们 将 它 作 为 练习 留 给 读者 。 


3.5.6 EXECUTE 宏 状态 : JALR 指令 (J 型 指令 部 分 ) 
J 型 指令 具有 如 下 的 格式 : 


31 2827 2423 2019 0 


将 JALR 指令 引入 LC-2200 指令 集中 用 于 支持 高 级 语言 的 过 程 调 用 机 制 。JALR 将 返回 地 
址 保存 在 寄存 器 中 并 将 控制 权 交 给 子 过 程 : 


Ry APC+ 1 
PC < Ry 


下 面 是 JALR 指令 的 微 状 态 、 数 据 通路 活动 和 控制 信号 : 
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» jalrl 
PC — Ry 
所 需 的 控制 信号 : 
DrPC 
RegSel = 01 
WrREG 


下 图 显示 了 jalrl 微 状态 的 数据 通路 活动 。 


32 
LdB LdMAR LdiR 
IR[31..0] 
WrREG ~~ WrMEM 
IR[19..0] 
4 
regno 





注意 : PCH 需要 被 保存 到 Ry 中 。 我 们 在 FETCH 宏 状态 中 已 经 递增 了 PC. 


。 jalr2 
Rx 一 PC 
所 需 的 控制 信号 : 
RegSel = 00 
DrREG 
LdPC 
下 图 显示 了 jalr2 微 状态 的 数据 通路 活动 。 
32 
LdPC 一 | PC | LdA LdB LdIR 
IR[31..0] 
2 WrREG - 
SG A IR[19..0] 
4 
regno 








DrPC F, DrALU \/ DrREG \/ 


? 
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3.5.7 EXECUTE 宏 状态 : LW 指令 (| 型 指令 部 分 ) 
I 型 指令 有 如 下 格式 : 


31 2827 2423 2019 0 





处 理 器 笑 现 


LW 指令 的 语义 是 : 


Ry <— MEMORY[Ry + signed address-offset] 


在 I 型 指令 中 ， 带 符号 地 址 偏 移 量 由 指令 的 一 部 分 作为 立即 值 字段 给 出 。 立 即 值 字段 占 
HIRANO ~ 19 位 。 从 数据 通路 中 可 以 看 出 ， 有 一 个 符号 扩展 硬件 将 这 20 位 补 码 值 转换 为 
32 位 补 码 。DrOFF 控制 线 使 得 IR 中 的 经 过 符号 扩展 后 的 偏 移 地 址 可 以 被 放 到 总 线 上 。 


下 面 是 LW 指令 的 微 状 态 、 数 据 通 路 活动 和 控制 信号 : 


e lwl 
Ry > A 
所 需 的 控制 信号 : 
RegSel = 01 
各 DrREG 
LdA 


下 图 显示 了 Iw1 微 状态 的 数据 通路 活动 。 
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LAPC LdA ga Ey LdB | LdMAR 





| 
LdiR 


IR[31..0] 


WrREG WrMEM 
IR{19..0] 


20- 





DrPC \/ DrALU \/ DrREG \/ 





。 lw2 
符号 扩展 偏 移 量 一 B 
所 需 的 控制 信号 ; 
DrOFF 
LdB 


下 图 显示 了 lw2 微 状态 的 数据 通路 活动 。 
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| | | 
i f | 
LdPC LdA EJ = LdB | LdMAR LdIR 


IR[31..0] 


WrREG WrMEM 
IR[19..0] 


20 
扩展 
DrPC DrALU -7 prREG -Ñ 7 DrMEM -Ñ 7 DrOFF -\ 7 





。 lw3 
A+B— MAR 


所 需 的 控制 信号 : 
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mai 0 


func = 00 
DrALU 
LdMAR 
下 图 显示 了 lw3 微 状态 的 数据 通路 活动 。 
32 
LdPC LdA a E LdB LdMAR — MAR LdiR 
| 32 | 
IRI31..0} 
2 WrREG WrMEM 
ii IR[19..0) 
4 20 
regno 





扩展 
DrPC \/ BA DrREG NU DrMEM ‘uf DrOFF \/ 





° lw4 
MEM[MAR] — Rx 
所 需 的 控制 信号 : 
DrMEM 
RegSel = 00 
WrREG 
下 图 显示 了 lw4 微 状态 的 数据 通路 活动 。 
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LdPC | PC | LdA woe) 


IR[31..0] 
2 WrREG —- WrMEM 
anes IR[19..0] 
4 20 
regno 





DrPC \ / DrALU V, DrREG \/ DrMEM T, DrOFF \ / 


我 们 现在 要 给 LC-2200 增加 一 种 新 的 寻 址 模式 ， 称 为 自动 递增 模式 。 该 模式 对 于 LW/SW 指令 
来 说 是 有 用 的 。 采 用 此 模式 的 LW 指令 语义 为 : 


LW Rx, (Ry)+ ; Rx + MEM[Ry]; 
: Ry < Ry + 1; 
指令 格式 如 下 : 
31 2827 2423 2019 0 


maje 


写 出 使 用 该 寻 址 模式 实现 的 LW 指令 的 序列 。( 你 需要 写 出 该 指令 的 EXECUTE 宏 状 态 的 序列 。) 对 
于 每 个 微 状态 ， 给 出 数据 通路 活动 (寄存 器 传输 形式 为 A 二 Ry)， 并 在 标 出 使 能 数据 通路 所 需 的 控制 信 
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LW1: Ry — A, MAR 
控制 信和 号; 
RegSel=01; DrReg; LdA; LdMAR 
LW2: MEM[Ry] — Rx 
控制 信号 : 
DrMEM; RegSel=00; WrREG 


LW3: A+t+1-— Ry 
控制 信号 : 


Func=11; DrALU; RegSel=01; WrREG 


3.5.8 EXECUTE 宏 状态 : SW 和 ADDI 指令 (1 型 指令 部 分 ) 


SW 宏 状态 的 实现 与 LW 宏 状态 类 似 。ADDI 宏 状 态 的 实现 与 ADD 宏 状态 类 似 ， 唯 一 的 
区 别 是 第 二 个 操作 数 来 自 IR 中 的 立即 值 而 不 是 男 一 个 寄存 右 。 这 两 个 宏 状 态 的 实现 就 留 给 读 


3.5.9 EXECUTE 宏 状 态 : BEQ 指令 (1 型 指令 部 分 ) 
BEQ 指令 有 如 下 语义 : 


if (Rx == Ry) then PC + PC + 1 + 符号 地 址 偏 移 量 

else 什么 都 不 做 

这 条 指令 需要 一 些 特殊 处 理 。 该 指令 的 语义 是 ， 比 较 两 个 寄存 器 (Rx 和 Ry) 中 的 内 容 ， 
如 果 它 们 相等 ， 则 跳 转 到 目的 地 址 ， 而 目的 地 址 是 符号 扩展 偏 移 量 与 PC+1 的 和 (了 PC 是 这 条 
BEQ 指令 的 地 址 )。 

数据 通路 中 ， 有 硬件 用 于 检测 总 线 上 的 值 是 否 为 零 。BEQ 的 微 状 态 使 用 这 个 逻辑 根据 两 
个 寄存 器 的 比较 结果 来 设置 Z 寄存 器 的 值 。 

下 面 是 BEQ 宏 状态 对 应 的 微 状 态 、 数 据 通路 活动 以 及 控制 信号 : 


* beql 
Rx >A 
所 需 的 控制 信号 ; 
RegSel = 00 
DrREG 
LdA 


下 图 显示 了 beql 微 状态 的 数据 通路 活动 。 
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LdPC LdA EJ TI LdB LdMAR 


WrREG WrMEM 





4 
regno 一 





DrPC i DrALU \/ DrREG W DrMEM Af 
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* beq2 
Ry 一 了 
所 需 的 控制 信号 : 
RegSel = 01 
DrREG 
LdB 


下 图 显示 了 beq2 微 状 态 下 的 数据 通路 活动 。 
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LdPC LdA EJ LdB 


LdIR 


IR[31..0] 


fune — 





DrPC \/ DrALU WF DrREG N7 


* beq3 
A-B 
HE PMP BNBRARALZSES 
所 需 的 控制 信号 : 
func = 10 
DrALU 
LdZ 


下 图 显示 了 beq3 微 状态 下 的 数据 通路 活动 。 
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LdPC LdA EJ LdB fa 
IRI31..0] 


WrREG 


wae IR[19..0] 





DrPC \/ DrALU \/ DrREG \/ 


= 07] 
1 
LdZ 


注意 : 数据 通路 中 的 零 检 测 逻 辑 元 件 一 直 在 检测 总 线 上 的 值 是 否 为 零 。 通 过 断言 LdZ，Z 
寄存 器 (1 位 寄存 器 ) 捕获 检测 结果 以 备 以 后 使 用 。 

与 其 他 指令 的 微 状 态 相 比 ， 这 个 微 状态 的 操作 更 具 技 巧 性 。 对 于 其 他 指令 ， 我 们 就 是 
简单 地 按 顺 序 走 一 遍 各 个 微 状 态 最 后 返回 到 FETCH 宏 状 态 。 然 而 ，BEQ 指令 根据 比较 的 结 
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果 引 起 控制 流转 移 。 如 果 Z 寄存 器 为 0 ( 即 Rx!=Ry)， 那 么 我 们 就 简单 地 返回 到 ifetchl 并 继 
续 顺 序 执行 下 一 条 指令 (PC 已 经 指向 了 该 条 指令 )。 另 一 方面 ， 如 果 Z 寄 存 器 为 1， 继续 用 
BEQ 微 状态 计算 分 支 的 目标 地 址 。 

首先 让 我 们 假设 分 支 发 生 以 完成 BEQ 的 各 微 状态 。 


* beq4 
PC 一 人 
所 需 的 控制 信号: 
DrPC 
LdA 
下 图 显示 了 beq4 微 状 态 下 的 数据 通路 活动 。 
32 
LdPC LdB | LdMAR LdiR 
IR[31..0] 
WrREG WrMEM 
iR[19..0] 
4 
regno 





DrPC AJ DrALU od DrREG Vf DrMEM A of 


* beq5 
偏 移 量 的 符号 扩展 一 B 
所 需 的 控制 信号 : 
DrOFF 
LdB 


下 图 显示 了 begs 微 状态 下 的 数据 通路 活动 。 
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LdPC LdA B LdB | LAMAR 


i 
a 


IR[31..0] 


WrREG WrMEM 
IR[19..0] 


20 


DrPC \/ DrALU A / DrREG iF DrMEM - \/ DrOFF aF. 





* beq6 
A + B — PC 
所 需 的 控制 信号 : 
func = 00 
DrALU 
LdPC 


Se eee |! A 


下 图 显示 了 beq6 微 状态 下 的 数据 通路 活动 。 
32 
LdIR 


IR[31..0] 


WrREG WrMEM 


IR[19..0] 





regno 





DrPC Ly DALU- / DrREG A DrMEM W, 


注意 : 在 FETCH 宏 状态 中 ，PC 已 经 递增 了 ， 所 以 这 里 我 们 可 以 将 PCSHST Rmt 
115| 量 相 加 来 计算 目标 地 址 。 


3.5.10 ”设计 微 程序 中 的 条 件 分 支 


图 3-26 展示 了 BEQ 宏 状 态 的 状态 转移 。beq3 微 指令 的 下 一 状态 (next-state) 字段 将 包 
含 beq4。 但 是 微 指令 中 只 有 一 个 下 一 状态 字段 ， 我 们 需要 让 beq3 根据 乙 寄存 器 的 状态 转移 
到 ifetchl 或 者 beq4。 一 种 时 间 上 高 效 的 办 法 是 ,在 ROM 上 的 其 他 单元 复制 一 份 与 ifetchl 有 
关 的 微 指 令 。 下 面 我 们 将 解释 这 是 如 何 做 到 的 。 


Z=1 
On 


图 3-26 BEQ 宏 状态 的 状态 转移 。 我 们 可 能 会 转移 到 ifetchl 或 beq4， 这 依赖 于 beq3 中 
计算 的 结果 ， 这 个 结果 在 beq3 结束 前 被 Z 寄存 器 捕获 


我 们 假设 状态 寄存 器 有 5 位 ，beq4 的 二 进 制 编码 为 010000，beq3 微 指令 的 下 一 状态 字 
段 设 置 为 beq4。 我 们 将 Z 寄存 器 的 内 容 作为 前 级 ， 得 到 6 位 的 ROM 地址。 如 果 Z 为 0， 则 
ROM 地 址 为 001000 ; 如 果 Z 为 1!1， 则 地 址 为 101000。 后 一 个 地 址 (101000 ) 是 我 们 要 存储 
与 bead 微 状态 有 关 的 微 指 令 的 地 方 。 而 001000 ( 称 为 ifetch-clone) 则 会 保存 与 原始 ifetch1 
一 样 的 微 指令 。 图 3-27 显示 了 这 个 设计 。 
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ROM 地 址 = 901000 


ifetch1-clone 


© © © 
Z=1 
(eat) © © 


ROM 地 址 = 101000 
图 3-27 设计 条 件 微分 支 。 使 用 5 位 基地 址 (01000) RHA Z 寄存 器 的 输出 作为 地 址 前 级 
我 们 还 可 以 将 这 个 想法 (复制 微 指令 ) 推广 到 任意 需要 在 微 程序 中 进行 条 件 分 文 的 情况 。 
3.5.11 Bik DECODE 宏 状 态 


我 们 回 到 DECODE 宏 状态 。 这 是 一 个 从 ifetch3 到 IR 指定 的 宏 状态 的 一 个 多 路 分 支 。 我 
们 使 用 的 技巧 与 之 前 根据 Z 寄存 需 内 容 为 BEQ 实现 2 路 分 支 时 的 一 样 。 

我 们 假设 10000 是 通用 的 EXECUTE 宏 状态 编码 。 

lfetch3 的 下 一 状态 字段 包含 这 个 通用 值 。 我 们 用 OPCODE 的 内 容 CIR 的 位 28 ~ 31) 作 
为 通用 值 的 前 级 来 产生 9 位 的 ROM 地址。 因此 ，ADD 宏 状 态 将 从 ROM 地 址 000010000 FF 
始 ，NAND 宏 状 态 将 从 地 址 000110000 开始 ，ADDI 则 从 001010000 开始 ， 等 等 。 如 图 3-28 
所 示 。 





000010000 000110000 


116 
图 3-28 为 DECODE 宏 状态 产生 多 路 分 支 。 使 用 5 位 基地 址 (10000)， 用 了 天 中 的 ， 
OPCODE (4 位 ) 作为 前 组 117 


将 所 有 这 些 集合 到 一 起 ， 我 们 发 现 处 理 紫 的 控制 逻辑 具有 10 位 地 址 : 

。 最 高 4 位 是 IR 的 28 ~ 31 位 。 

。 下 一 位 是 Z 寄存 器 的 输出 。 

。 最 低 5 位 来 自 5 HORA ATE aE. 

最 高 4 位 (OK AIR AY 28 ~ 31 位 ) 应 当 为 0， 除 非 我 们 想 在 FETCH KIRS RKE 
ifetch3 LORA) 进行 多 路 选择 。 类 似 地 ， 下 一 位 (来 自 Z 寄存 器 的 输出 ) 应 该 为 0， 除 了 在 
beq3 微 状态 下 需要 做 2 路 分 支 。 为 了 确保 能 正确 地 按照 我 们 的 选择 修改 ROM 地 址 的 高 5 位 ， 
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我 们 在 ROM 的 每 个 表 项 中 添加 额外 的 两 个 1 位 字段 ， 称 为 M AIT, ( 见 图 3-29.) 这 些 字 段 分 
别 控制 在 这 个 时 钟 周期 中 是 否 要 用 来 自信 的 4 位 和 来 自 乙 寄存 器 的 1 位 修改 ROM 地址。 如何 
使 用 图 3-30 给 出 的 修改 控制 电路 来 完成 控制 单元 设计 作为 练习 留 给 读者 ( 见 练习 17 )。 


Per 驱动 信号 加 载 信号 ses | | “| 下 一 状态 和 修改 者 
2 状态 


图 3-29 ROM 表 项 的 最 终 设 置 . 我们 给 ROM PREMER MAIT R 
改 者 ”位 





图 3-30 中 控制 单元 的 输入 /输出 信号 直接 与 图 3-15 中 的 对 应 信和 号 


DrPC, DrALU, DrREG, 
DrM EM, DrOFF 


LdPC, LdA, LdB, LAMAR, 
LdIR, LdZ, WrREG, WrMEM ) mai 数据 通路 


func 





图 3-30 LC-2200 控制 单元 。 这 展示 了 完整 的 ROM 寻 址 机 制 ， 以 及 所 有 需要 产生 并 发 送 
给 数据 通路 的 控制 信号 


3.6 ”控制 单元 设计 的 另 一 种 选择 
我 们 来 考虑 处 理 天 控制 单元 不 同 风 格 的 实现 。 
3.6.1 微 程序 控制 


在 3.5 节 中 ,我们 给 出 了 微 程序 风格 的 控制 单元 设计 。 这 种 风格 的 确 很 优雅 ， 也 很 向 单 
晶 易 于 维护 。 使 用 微 程序 设计 的 好 处 是 ， 控 制 逻辑 就 像 ROM 中 的 一 段 程序 ， 因 此 非常 易 于 
维护 。 但 是 ， 微 程序 设计 有 两 个 潜在 的 低 效 之 处 。 第 一 个 与 时 间 有 关 。 为 了 在 某 个 时 钟 周期 
中 产生 控制 信号 ， 需 要 问 igloos Ph it 然后 再 经 过 一 段 称 为 访问 时 间 的 延迟 后 ， 控 
制 信和 号 才 在 数据 通路 上 可 用 。 这 个 时 间 代 价 发 生 在 每 个 时 钟 周期 的 关键 路 径 上 ， 因 此 成 为 了 
性 能 损失 的 一 个 原因 。 然 而 ， de 即 在 一 条 指令 执行 时 提前 取出 下 一 条 指令 ， 这 个 时 
间 代 价 可 以 被 屏蔽 。 第 二 个 与 空间 有 有关。 前 面 小 节 中 给 出 的 设计 属于 微 程序 设计 中 的 水 平 微 
码 风格 ,在 这 种 设计 中 整个 控制 通路 中 的 每 个 控制 信号 都 与 微 指 令 中 的 一 位 相对 应 。 从 之 前 
讨论 的 情况 来 看 ， 对 于 大 多 数 微 指令 ， 这 些 位 中 的 大 部 分 都 是 0， 只 有 少数 为 1， 与 该 时 钟 周 
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期 所 需 的 控制 信号 吻合 。 例 如 ,在 ifetch1 中 ， 只 有 DrPC、LdMAR、LdA 是 1， 微 指令 中 的 
其 他 位 都 是 0. 水 平 微 码 在 空间 上 的 低 效 可 以 通过 采用 一 种 称 为 重 直 微 码 的 技术 来 克服 ， 而 
垂直 微 码 与 写 汇 编 相 类 似 。 不 同 微 指令 中 同一 位 的 位 置 表示 了 不 同 的 控制 信号 ， 这 又 依赖 于 
每 条 垂直 微 指令 中 的 操作 码 (OPCODE) Fe. HEARS PARISH, AWK ARES Hl 
位 的 位 置 表示 的 控制 信号 需要 互 斥 。 


3.6.2 ABER hil 


我 们 仔细 研究 3.5 节 中 设计 的 使 用 水 平 微 码 的 ROM 究竟 表示 了 什么 是 有 益 的 。 它 实际 上 
是 一 个 真 值 表 ， 给 出 了 数据 通路 所 需要 的 所 有 控制 信号 。ROM 的 行 表 示 状 态 ， 列 表示 的 是 函 
数 (每 一 列 对 应 一 个 控制 信号 )。 基 于 前 面 对 锡 辑 设计 的 介绍 ， 读 者 应 该 知道 如 何 合成 每 列 所 
需要 的 最 小 布尔 逻辑 。 这 些 人 逻辑 函数 比 真 值 表 更 有 效 . 

我 们 可 以 使 用 组 合 逻辑 电路 来 实现 控制 信号 对 应 的 布尔 逻辑 图 数 。 顶 数 的 功能 就 是 在 某 
个 状态 下 给 出 的 某 些 控制 信号 。 

例如 ，DrPC 的 布尔 困 数 可 能 是 : 

DrPC = ifetchl + jalrl + beq4 + --- 

使 用 AND/OR |], #13 NAND/NOR 这 样 的 通用 门 ， 我 们 可 以 生成 所 有 的 控制 信号 。 
我 们 将 这 种 类 型 的 设计 称 为 硬 连 线 控 制 ， 因 为 控制 信号 都 是 使 用 组 合 逻 辑 电 路 来 实现 的 (不 
容易 修改 ， 所 以 称 为 硬 连 线 )。 这 样 的 设计 在 时 间 和 空间 上 都 很 有 效 (不 需要 ROM 查找 的 访 
问 时 间 ， 也 不 需要 为 时 钟 周 期 内 没有 产生 的 控制 信号 浪费 空间 )。 过 去 有 一 些 反 对 者 认为 ， 因 
为 使 用 随机 逻辑 来 实现 布尔 图 数 ， 所 以 这 将 导致 璐 梦 般 的 维护 工作 。 

然而 ， 可 编程 逻辑 阵列 ( PLA) 和 现场 可 编程 门 阵列 (FPGA) 的 出 现 使 得 这 些 反 对 苑 日 
无 力 。 例 如 ，PLA 将 所 需要 的 逻辑 组 织 成 二 维 阵列 结构 ， 从 而 让 随机 逻辑 有 了 结构 。 我 们 在 
图 3-31 中 给 出 了 这 种 结构 。 


PLA 输入 OR th 





PLA 输出 
图 3-31 PLA. 左边 的 输入 来 自 状态 寄存 器 和 影响 处 理 器 COIR Al Z 寄存器) 状态 的 数 
据 通 路 元 件 。 每 个 输出 是 输入 的 SUM-of-PRODUCT 的 结果 ， 这 些 输出 就 是 数 
据 通路 所 需 的 控制 信号 


输出 是 驱动 数据 通路 所 需 的 控制 信号 (DrPC、DrALU 等 )。 输 入 是 处 理 希 所 处 的 状态 


52 ie 3 


(ifetch|. ifetch2 等 ) 和 效 据 通路 中 产生 的 条 件 CIR Al Z AF FE AEA ESE). AND 板 中 的 每 
个 门 都 获得 所 有 的 输入 (在 正确 而 完整 的 版 本 中 是 这 样 的 )。 类 似 地 ，OR 板 中 的 每 个 门 也 
部 获得 AND 板 产 生 的 所 有 结果 。PLA 之 所 以 称 为 PLA， 是 因为 它 上 面 的 逻辑 可 以 通过 选择 
哪些 输入 传送 给 AND 板 和 OR 板 而 “编程 。 每 个 PLA 输出 都 是 逻辑 乘 的 逻辑 加 ( SUM-of- 
PRODUCT) 的 结果 .逻辑 乘 (PRODUCT) 是 在 AND 板 中 实现 的 。 逻 辑 加 ( ADD) 是 在 OR 
板 中 实现 的 。 这 种 设计 将 所 有 控制 逻辑 都 集中 在 一 起 ， 就 有 了 人 微 程序 设计 的 结构 优势 。 同 时 ， 
因为 控制 信号 使 用 组 合 逻 辑 电路 产生 ， 所 以 它 没有 硬 连 线 设 计 的 不 足 。 与 随机 逻辑 的 设计 相 
比 ， 它 在 空间 的 使 用 上 稍微 有 些 劣 势 ， 因 为 每 个 AND PAN bd A ab PLA 的 总 输入 数 相同 ， 
而 每 个 OR TIA A BABS AND 板 中 AND 门 的 数量 相同 。 无 论 如 何 ，PLA 的 结构 化 优点 和 
规则 性 远 远 超过 了 它 的 劣势 ，VLSI 设计 已 经 离 不 开 它 . 

iit, FPGA 变 得 非常 流行 ， 它 用 来 为 复杂 的 人 硬件 设计 迅速 制造 原型 。FPGA 其 实 是 PLA 
的 继承 者 ， 它 含有 逻辑 元 件 和 存储 元 件 。 这 些 元 件 之 间 的 连接 可 以 “现场 ”进行 编程 ，FPGA 
正 是 由 此 得 名 。 这 样 的 灵活 性 使 得 设计 上 的 缺陷 更 容易 修正 ， 甚 至 在 部 署 之 后 依然 如 此 ， 因 
此 也 提高 了 便 连 线 设计 的 可 维护 性 ， 


3.6.3 在 两 种 控制 设计 风格 中 选择 


在 这 两 种 风格 之 间 进 行 选择 受到 许多 因素 的 影响 。 我 们 已 经 给 出 了 两 种 控制 风格 的 优势 
和 劣势 。 也 许 由 于 FPGA 的 出 现 ， 许 多 针对 硬 连 线 控制 可 维护 性 的 争论 已 经 停止 了 。 尽 管 如 
此 ， 对 于 处 理 需 的 基本 实现 ( 即 非 流水 线 )， 或 者 对 于 复杂 指令 的 实现 (如 x86 体系 结构 中 的 
那些 )， 更 倾向 于 使 用 微 程序 控制 ， 因 为 它 很 灵活 也 很 容易 快速 修改 。 男 一 方面 ， 我 们 将 在 流 
水 线 处 理 器 的 有 关 章 节 中 看 到 ， 高 端 流水 线 处 理 右 的 实现 非常 适合 使 用 硬 连 线 控制 。 表 3-2 
总 结 了 这 两 种 设计 思路 的 优 劣 


表 3-2 控制 方法 比较 


控制 方法 
微 程序 简单 、 易 维护 、| 可 能 在 时 间 和 空 | 在 采用 垂直 微 编 | 用 于 复杂 指令 ; PDP 11 系列、 
灵活 、 快 速 开发 ”| 间 上 都 比较 低 效 码 时 空间 上 的 低 效 | 非 流 水 体系 结构 的 |IBM 360/370 系列 、 
会 得 到 缓解 ， 使 用 | 快速 原型 开发 Motorola 68000, 
预 取 可 以 缓解 时 间 Intel x86 体系 结构 
上 的 低 效 中 的 复杂 指令 
可 以 通过 使 用 | 用 于 高 性 能 的 流 | 大 多 数 现代 处 理 
结构 化 的 硬件 (如 | 水 线 体系 结构 实现 | Ar, LHA Intel Xeon 
PLA 和 FPGA) 来 系列 、IBM PowerPC 
改善 可 维护 性 

















































硬 连 线 可 能 难以 修改 设 


计 ， 设 计时 间 更 长 


适合 于 流水 线 
实现 ， 有 达到 更 
高 性 能 的 潜力 











小 结 


在 本 章 中 ， 我 们 感受 了 如 何 为 给 定 的 指令 集 设 计 处 理 器 。 第 一 步 的 实现 是 选择 数据 通路 
并 将 各 个 元 件 组 装 到 数据 通路 上 -。 我 们 在 3.3 节 回 顾 了 基本 数字 逻辑 元 件 ， 在 3.4 节 回 顾 了 数 
据 通 路 设计 。 当 数据 通路 确定 后 ， 我 们 将 注意 力 转 移 到 驱动 数据 通路 完成 指令 集 的 控制 单元 
的 设计 。 基 于 微 程序 控制 单元 的 假设 ，3.5 节 大 致 浏览 了 实现 LC-2200 ISA 中 各 指令 所 需 的 微 
状态 。 在 3.6 节 ,， 我们 评价 了 硬 连 线 控制 与 微 程序 控制 的 区 别 。 
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历史 回顾 


我 们 最 好 回头 看 看 ， 历 史上 人 性 能 的 取舍 如 何 受到 经 济 与 技术 条 件 的 影响 。 

在 20 世纪 40 年 代 和 20 世纪 50 年 代 ， 构 建 硬 件 和 存储 器 所 需 的 逻辑 单元 极为 昂贵 。 当 
时 采用 的 技术 是 电子 管 ， 后 来 是 单独 的 晶体 管 来 实现 硬件 。 指 令 集 体系 结构 都 非常 简单 ， 一 
般 都 有 一 个 单独 的 寄存 器 ， 称 为 累加 器 。 那 个 时 代 的 计算 机 以 EDSAC M IBM 701 为 代表 。 

在 20 世纪 60 年 代 ， 开 始 出 现 少 许 的 “集成 ” 。1965 年 ， 推 出 的 IBM 1130 采用 固态 逻辑 
技术 (Solid Logic Technology，SLT)， 这 是 后 来 集成 电路 的 先驱 。 那 个 年 代 硬件 价格 出 现 大 幅 
下 降 ， 但 存储 需 依 然 使 用 磁 芯 ( 称 为 芯 存 储 器 )， 在 计算 机 系统 的 成 本 中 占 了 一 大 部 分 。 

这 种 趋势 持续 发 展 ， 到 了 20 世纪 70 年 代 ， 出 现 了 SSI (小 规模 集成 )， 还 有 MSI (中 规 
模 集 成 )， 电 路 作为 实现 处 理 絮 的 技术 。 半 导体 存储 器 在 20 世纪 70 年 代 开 始 取 代 芯 存储 器 的 
地 位 。 有趣 的 是 ， 大 约 在 1974 年 ， 世 存储 器 和 半导体 存储 器 每 位 存储 的 价格 几乎 是 一 样 的 
(每 位 0.01 美元 )。 从 那 时 到 现在 ， 半 导体 存储 器 的 价格 一 直 迅 速 下 降 。 

20 世纪 70 年 代 经 历 了 许多 不 同 的 体系 结构 ， 例 如 面向 栈 的 、 面 向 内 存 的 、 面 向 寄存 器 
的 等 各 种 体系 结构 。 那 个 时 代 机 器 的 代表 有 IBM 360 和 DEC PDP-11， 这 些 是 面向 内 存 和 面 
回 寄 存 硕 相 结 合 的 体系 结构 ， 还 有 面向 栈 的 Burroughs B-5000。 这 些 机 器 都 属于 存储 程序 计 
算 机 ， 即 通常 所 说 的 以 计算 机 先锋 John von Neumann 命名 的 冯 ， 诺 依 曼 体系 结构 。 

在 存储 程序 计算 机 发 展 的 同时 ， 计 算 机 科学 家 还 实验 了 非常 新 颖 的 体系 结构 ， 包 括 数 据 
流 和 收缩 系统 。 这 些 体系 结构 的 目的 在 于 让 程序 员 控 制 多 条 指令 并 行 执 行 ， 打 破 存储 程序 模型 
固有 的 指令 串 行 执行 方式 。 数 据 流 系 统 和 收缩 系统 都 着 眼 于 数据 而 非 指令 。 数 据 流 系统 允许 任 
何 输入 已 经 就 绪 的 指令 得 到 执行 ， 并 将 执行 结果 传送 给 其 他 指令 。 收 缩 系 统 允 许 并 行 数据 流通 
过 功能 元 件 的 阵列 (这 个 阵列 经 过 预先 的 安排 以 完成 某 种 特定 功能 ) 完成 对 数据 流 的 计算 ( 例 
如 ， 和 矩阵 乘法 )。 数 据 流体 系 结构 是 通用 计算 模型 的 一 个 实现 ， 而 收缩 系统 则 是 合成 体系 结构 
( synthesizing architectures) 中 的 一 种 具体 算法 模型 。 虽 然 这 些 类 型 的 体系 结构 并 没有 取代 存储 程 
序 计算 机 ， 但 它们 对 计算 机 整体 ， 从 算法 设计 到 人 处 理 器 实现 ， 都 产生 了 巨大 的 影响 。 

20 世纪 80 年 代 ， 出 现 了 一 些 有 趣 的 发 展 。 首 先 ， 使 用 双 极 晶体 管 的 高 速 LSI (大 规模 集 
成 ) 电路 已 很 常见 。 这 成 了 许多 高 端 处 理 器 采用 的 实现 技术 ， 如 IBM 370 和 DEC VAX 780. 
为 一 个 趋势 是 ， 使 用 CMOS 品 体 管 (也 称 为 场 效 应 管 或 FET) 的 VLSI (超大 规模 集成 ) 电 
路 开始 用 于 单 芯 片 的 微 处 理 器 。20 世纪 80 年 代 末 及 90 年 代 初 ， 这 些 杀手 级 微 处 理 器 在 性 价 
比 上 对 高 端 机 需 市 场 产 生 了 威胁 。20 世纪 80 年 代 ， 编 译 右 技术 也 迅速 发 展 ， 形 成 了 实质 上 
的 系统 软件 (如 编译 需 ) 与 指令 集 设计 之 间 的 合作 关系 。 这 种 关系 为 RISC (精简 指令 集 计算 
HL) 体系 结构 铺 平 了 道路 。IBM 801、Berkeley RISC 和 Stanford MIPS 引领 了 这 场 RISC 革命 。 
ARAJE, CISC (复杂 指令 集 计 算 机 ) 体系 结构 的 追随 者 依旧 很 多 ， 例 如 Motorola 68000 和 
Intel x86 系列 处 理 右 。 因 为 新 的 集成 技术 能 够 将 更 多 的 晶体 管 放 到 一 块 硅 片 上 ， 所 以 下 到 20 
世纪 80 年 代 还 只 存在 于 高 端 处 理 需 上 的 流水 线 处 理 需 设计 〈 见 第 $ 章 ) 开始 进军 微 处 理 需 。 
KF RISC 和 CISC 的 争论 逐渐 减少 ， 问 题 变 成 了 如 何在 一 个 流水 处 理 硕 中 达到 每 个 时 钟 周 期 
一 条 指令 的 吞吐 量 。 

在 20 世纪 90 EAR, moi (使 用 CMOS 技术 的 单 芯 片 微 处 理 器 ) 最 终 确立 了 它 作 为 计算 
机 工业 界 处 理 器 实现 技术 的 地 位 。20 世纪 90 FARK, Intel x86 和 Power PC 指令 集 (这 两 种 指 
令 集 都 属于 采用 了 部 分 RISC 体系 结构 实现 技术 的 CISC 体系 结构 处 理 需 系列 ) 成 为 制造 更 面 计 
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算 机 、 服 务 器 、 超 级 计算 机 的 工业 标准 。 值 得 一 提 的 是 ， 那 个 年 代 最 有 和 硕 望 的 体系 结构 是 DEC 
Alphas PWE, HF DEC 在 20 世纪 90 年 代 后 期 死去 ，Alpha 体系 结构 也 就 安息 了 。 

随 着 个 人 通信 设备 (FOL, FHL, PDA) 及 游戏 设备 的 出 现 ， 髓 人 式 计 算 平 台 从 20 Tt 
纪 80 年 代 开始 越 来 越 重要 。 大 部 分 的 舱 入 式 平台 采用 RISC 体系 结构 的 ARM ( Acorn RISC 
Machine 的 缩写 ， 最初 由 Acorn Computer 设计 ) 的 各 种 型 号 。Intel 制造 了 从 最 初 ARM 体系 结 
构 衍生 出 的 XScale 处 理 器 。 值 得 一 提 的 是 ，ARM 处 理 器 一 开始 是 打算 为 PC 和 工作 站 设计 的 。 

超标 量 和 超 长 指令 字体 系 结构 (VLIW) 处 理 器 体现 了 RISC 革命 中 产生 的 技术 。 两 者 
都 是 为 了 提高 处 理 器 的 吞吐 量 。 它 们 通常 称 为 多 发 射 处 理 器 。 超 标量 处 理 器 依靠 硬件 来 并 行 
执行 固定 数量 的 不 相互 依赖 的 相 邻 指令 。 对 于 VLIW ， 顾 名 思 义 ， 一 条 指令 实际 上 包含 了 多 
个 捆绑 在 一 起 的 操作 。VLIW 严重 依赖 于 编译 技术 来 降低 硬件 设计 的 复杂 性 并 为 其 开发 并 行 
性 。 从 20 世纪 80 年 代 后 期 第 一 次 提出 以 来 ，VLIW 技术 在 这 些 年 间 已 经 重新 改进 了 许多 次 。 
VLIW 体系 结构 最 近 的 一 次 改进 是 Intel 的 IA-64， 针 对 的 是 超级 计算 市 场 。VLIW 体系 结构 
在 高 端 府 人 式 领 域 也 很 受 欢 迎 ， 如 DSP (数字 信号 处 理 ) 应 用 。 

我 们 已 经 迎 来 了 新 千年 的 第 一 个 10 年 的 结束 。 如 今 关于 指令 集 的 争论 很 少 。 大 部 分 工作 都 
位 于 微 体 系 结构 的 层面 ， 即 ， 如 何 通过 各 种 硬件 技术 来 提高 处 理 需 的 性 能 。 同 时 ， 集 成 度 的 提 
高 也 允许 将 多 个 处 理 器 放 在 单 块 硅 片 上 。 多 核 芯 片 开始 出 现在 大 部 分 我 们 购买 的 计算 机 系统 上 。 


练习 题 


1. 电 平 逻辑 与 边沿 触发 逻辑 的 区 别 是 什么 ”我 们 在 实现 ISA 时 用 的 是 哪 种 ”为 什么 ? 

2. 给 出 一 个 车 库 门 开关 控制 器 的 FSM 和 状态 转移 表 ( 见 图 3-12 MK 3-1 )， 用 时 序 逻 辑 电 路 实现 这 个 控 
制 器 。( 提 示 : 这 个 时 序 逻 辑 电 路 包含 2 个 状态 ， 产 生 3 种 输出 ， 即 下 一 状态 、 开 门 信号 、 关 门 信号 。) 

3. 使 用 本 章 介 绍 的 ROM 加 状态 寄存 器 方式 重新 实现 练习 2 中 的 逻辑 电路 。 

. 对 比 控制 逻辑 的 不 同 设计 方法 . 

. 对 基于 ROM 的 控制 方式 ， 一 种 减少 空间 需求 的 方法 是 将 各 个 独立 的 控制 信号 用 ROM 中 的 一 个 编码 字 
段 表 示 。 这 种 方法 的 优点 和 缺点 是 什么 ”哪些 控制 信号 能 聚集 在 一 起 ， 而 哪些 不 能 ? 给 出 你 的 理由 。 

. 基于 总 线 的 数据 通路 设计 有 哪些 优点 和 缺点 ? 

考虑 一 个 三 总 线 设 计 。 你 如 何 使 用 它 来 组 织 图 3-10 中 的 双 总 线 数据 通路 上 的 那些 元 件 ? 与 双 总 线 设 

计 相 比 ， 它 有 什么 好 处 ? 

. 解释 为 什么 内 部 寄存 器 ， 如 指令 寄存 器 (IR) 和 内 存 地 址 寄存 器 ( MAR )， 不 应 由 控制 单元 在 ISA 的 
实现 中 用 于 数值 的 临时 存储 天 。 

9. 一 位 工程 师 希 望 将 实现 FETCH 宏 状态 的 微 状态 数量 减少 到 2 个 。 请 问 她 该 如 何 完成 这 个 目标 呢 ? 

10. 定 长 指令 的 优势 是 什么 ? 

11. 给 出 下 图 的 数据 通路 ， 假 设 所 有 的 线 都 是 16 位 宽 。 填 写 下 面 的 表格 。 

12. 在 LC-2200 处 理 器 中 ， 为 什么 在 ALU Ja mie Ay Frat? 

13. 扩展 LC-2200 ISA 以 便 包 含 一 条 减法 指令 。 给 出 该 减法 指令 所 需 的 微 状 态 ， 假 设 数据 通路 如 图 3-15 所 示 。 

14. 在 图 3-15 的 数据 通路 中 ， 为 什么 我 们 需要 ALU 前 面 的 寄存 器 A 和 B ? 为 什么 我 们 需要 MAR ? 什 
么 情况 下 你 不 需要 它们 ? (提示 : 考虑 寄存 器 堆 和 总 线 上 的 额外 端口 。) 

15. 芯 存 储 器 曾经 是 每 位 0.01 美元 。 考 虑 你 的 计算 机 ， 按 照 这 个 价格 ， 内 存 需要 花 多 少 钱 ? 如果 现 在 的 
内 存 还 是 这 个 价 ， 会 对 计算 机 产业 造成 什么 影响 ? 

. 如 果 计 算 机 设计 者 只 关注 速度 而 忽略 价格 因素 ， 那么 如 今 的 计算 机 产业 将 是 怎样 ? 谁 会 是 消费 者 ? 
如 果 仅 仅 考虑 价格 呢 ， 又 会 怎样 ? 
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17. 在 3.5.11 节 中 ， 我 们 引入 了 两 个 额外 的 字段 ，M 和 T， 作 为 下 一 状态 修改 位 。 这 两 位 允许 我 们 在 给 
定时 钟 周 期 中 有 选择 地 修改 ROM 地 址 的 高 位 。 使 用 这 些 下 一 状态 修改 位 来 完成 图 3-30 中 的 控制 单 
元 逻辑 . 
18.( 设 计 题 ) 
考虑 一 个 使 用 面向 栈 的 指令 集 的 CPU。 算 术 指 令 的 操作 数 和 结果 都 放 在 栈 上 ， 这 种 体系 结构 中 
没有 通用 寄存 器 。 
下 图 所 示 的 数据 通路 使 用 了 两 块 分 离 的 内 存 : 一 块 65 536 ( 2") 字 节 的 内 存 用 于 保存 指令 和 CGE 
栈 上 的 ) 数据 ， 一块 256 字 节 的 内 存 用 来 保存 栈 。 栈 使 用 常规 内 存 和 一 个 栈 指针 寄存 器 实现 。 栈 从 
地 址 0 开始 ， 压 人 数据 后 往 上 增长 〈( 即 往 高 地 址 增长 )。 栈 指针 指向 栈 顶 的 元 素 ( 当 栈 为 空 时 ， 栈 指 
针 为 -1 )。 你 可 以 忽略 栈 上 海 或 下 汶 的 问题 。 
程序 /数据 内 存 使 用 的 内 存 地 址 都 是 16 位 。 所 有 的 数据 都 是 8 位 宽 。 假 设 程序 /数据 内 存 为 字 
节 可 寻 址 ， 即 每 个 地 址 对 应 一 个 8 位 的 字 节 。 每 条 指令 包含 8 位 的 操作 码 。 许 多 指令 还 包括 一 个 16 
位 的 地 址 字段 。 指 令 集 在 下 面 给 出 。 这 里 ,“ 内 存 ” 指 的 是 程序 / 数据 内 存 (而 不 是 栈 内 存 )。 


操作 码 操作 
00000000 将 内 存 地 址 <addr> 中 的 内 容 压 入 栈 中 
00000001 将 栈 顶 的 元 素 弹 出 并 存 人 内 存 地 址 <addr> 中 
00000010 将 栈 顶 的 两 个 元 素 弹 出 ， 并 将 它们 相 加 之 和 压 人 栈 中 


00000100 将 栈 顶 的 两 个 元 素 弹出 ， 如 果 它 们 相等 ， 则 转移 到 内 存 地 址 <addr> 126 
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注意 ADD 指令 只 有 8 位 ， 但 其 他 指令 都 是 24 位 。 指令 在 内 存 中 是 紧密 连续 存放 的 〈 即 并 不 假设 所 
有 指令 都 是 24 位 长 ). 

假设 内 存 宽度 为 8 位 ， 即 每 次 对 内 存 的 读 / 写 操作 都 是 对 其 中 的 8 位 指令 或 数据 进行 访问 。 这 意味 
着 取 一 条 多 字 节 的 指令 需要 多 次 内 存 访问 


(a) 数据 通路 
补 全 下 面 的 设计 . 
we 16 fi 
8 位 





MAddrSel 







MemRead MemWrite 





零 检测 (输入 为 
0 时 ， 输 出 为 1) 


AWrite 






DS Sel DSWrite 


Stk_ALU_Op 





BWrite 


假设 读 或 写 程序 /数据 内 存 或 栈 内 存 都 需要 一 个 时 钟 周期 来 完成 (实际 上 ， 应 该 更 短 一 些 ， 因 为 要 
留 出 时 间 来 读 / 写 寄存 器 )。 同 样 ， 假 设 每 个 ALU 算术 运算 需要 的 时 间 略 少 于 一 个 时 钟 周期 。 零 检测 电 
路 需要 的 时 间 可 以 忽略 。 

(b) 控制 单元 

给 出 控制 单元 的 状态 表 ， 指 出 表 中 每 个 状态 必须 给 出 的 控制 信号 。 


参考 文献 注释 和 扩展 阅读 


逻辑 设计 基础 方面 有 不 少 好 书 [Katz，2004 ; Mano, 2007]. Patt 和 Patel[Patt, 2004] 的 教材 从 基本 
逻辑 设计 开始 ， 接 着 是 机 器 语言 编程 ， 最 终 以 介绍 C 语言 结束 。 讲 述 计算 系 组 成 与 设计 的 教材 有 很 多 
[Patterson, 2008; Stallings, 2010; Tanenbaun, 2005; Hamacher,2001]。Maurice Wilkes 是 一 位 计算 机 先驱 ， 
他 成 绩 很 好 ， 拿 过 很 多 次 第 一 名 。1951 年 ， 他 是 组 织 处 理 器 控制 单元 的 微 程序 技术 的 发 明 者 [Wilkes， 
1951]。 该 技术 被 工业 界 广 泛 用 于 实现 复杂 的 计算 机 结构 。Wilkes 获得 过 很 多 奖项 ， 包 括 1967 年 ACM 

128| ”图 灵 奖 、1980 年 Eckert-Mauchly 奖 ， 其 中 后 者 是 由 IEEE Computer Society 和 ACM 颁发 的 。 
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在 前 一 章 中 ， 我 们 讨论 了 处 理 器 的 实现 。 本 章 ， 我 们 将 讨论 如 何 让 处 理 器 能 够 处 理 程 序 
执行 中 的 不 连续 性 。 在 条 种 意义 上 ， 分支 指令 和 过 程 调用 也 是 一 种 不 连续 。 然 而 ， 这 些 不 连 
续 都 是 程序 员 有 意 加 入 程序 中 的 。 我 们 在 本 章 探 讨 的 不 连续 性 指 的 是 那些 无 法 预知 的 ， 甚 至 
不 属于 程序 本 吴 的 不 连续 性 。 

我 们 来 看 一 个 简单 的 比喻 。 在 一 个 教室 里 ， 教 授 在 讲授 计算 机 体系 结构 。 为 了 增强 互动 ， 
他 希望 同学 提问 题 。 他 有 两 种 选择 : 1 ) 每 隔 一 段 时 间 ， 他 停 下 来 询问 学 生 是否 有 问题 要 问 ; 
2) 他 告诉 学 生 ， 只 要 有 问题 ， 随 时 可 以 举 手 提 问 。 显 然 ， 第 一 种 方式 抑制 了 学 生 的 自发 性 。 
当 教 授 让 学 生 提 问 时 ， 学 生 可 能 已 经 忘记 问题 是 什么 了 。 更 坏 的 情况 是 ， 他 们 有 许多 问题 ， 
一 个 接 一 个 的 ， 叶 致 现在 已 经 完全 跟 不 上 课程 了 ! 第 二 种 方式 保证 了 学 生 及 时 得 到 回答 ， 不 
会 打 断 思路 。 但 还 有 个 小 问题 。 教授 应 该 什么 时 候 让 学 生 提问 呢 ? 他 可 以 在 学 生 举 手 时 立即 
啊 应 ， 但 可 能 当前 的 话 才 说 了 一 半 。 所 以 ， 他 应 该 先 说 完 现 在 的 话 ， 再 接受 学 生 提 问 。 教 授 
需要 记 住 目 己 讲 到 哪里 了 ， 这 样 在 回答 问题 后 还 能 接着 继续 讲 。 如 果 在 教授 回答 某 个 问题 时 ， 
又 有 一 个 学 生 举 手 ， 又 该 怎么 办 ? 这 样 下 去 教授 很 快 就 会 月 溃 。 所 以 ， 一 条 基本 原则 是 ， 在 
教授 回答 完 某 个 学 生 的 提问 前 ， 不 接受 其 他 学 生 的 提问 。 我 们 从 这 个 教室 的 比喻 中 提炼 出 两 
Ka: 记 住 课程 进度 ; 茶 止 进一步 的 提问 。 





我 们 设计 的 处 理 需 能 够 执行 指令 ， 但 如 果 它 不 能 与 外 界 进行 IO 通信 ， 那 就 没有 用 。 基 
于 前 面 的 比喻 ,我们 可 以 让 处 理 需 周期 性 地 询问 输入 设备 (如 键盘 )。 一 方面 ， 轮 询 是 易 出 错 
的 ， 因 为 设备 产生 数据 的 速率 可 能 要 比 轮 询 的 速率 更 快 。 男 一 方面 ， 如 果 设 备 并 没有 产生 数 
据 ， 那 么 处 理 器 轮 询 设备 就 是 浪费 时 间 。 所 以 ,我 们 借鉴 教室 中 的 方法 ， 让 设备 中 断 处 理 需 ， 
让 处 理 器 知道 设备 有 话 对 它 说 。 与 教室 类 似 ， 处 理 器 需要 记 住 当前 程序 执行 到 什么 地 方 ， 且 
禁止 其 他 中 断 直到 处 理 完 当 前 中 断 。 
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4.1 程序 执行 中 的 不 连续 性 


在 第 3 曹 中， 我 们 定义 了 摘 述 逻辑 电路 行为 的 术语 : 同步 和 措 步 。 考虑 一 个 现实 生活 中 
的 例子 。 假 设 你 走 到 冰箱 前 并 拿 出 一 瓶 苏打 水 ， 这 是 同步 事件 。 这 是 你 计划 中 的 一 部 分 。 另 
一 方面 ， 当 你 在 房间 里 写作 业 时 ， 你 的 室友 突然 问 进 来 给 了 你 一 瓶 苏 打 水 ， 这 就 是 异步 事件 
了 。 因 为 这 并 不 在 你 的 计划 中 。 打 电话 是 同步 事件 ， 而 接 电 话 则 是 异步 事件 。 

我 们 将 同步 和 异步 的 定义 推广 到 系统 的 硬件 和 软件 上 。 同 步 事 件 就 是 在 规定 好 的 时 间 发 
生 的 事件 (如 果真 的 发 生 了 )， 属 于 系统 计划 中 的 活动 。 第 3 草 讨论 的 各 个 微 状态 之 间 的 转移 
都 是 硬件 系统 中 同步 事件 的 例子 。 同 样 ， 在 程序 中 打开 一 个 文件 是 软件 的 同步 事件 。 

异步 事件 就 是 与 系统 正在 进行 的 其 他 活动 相关 的 在 不 可 预料 的 时 间 发 生 的 事件 (如 果真 
的 发 生 了 )。 我 们 很 快 就 会 看 到 ， 中 断 是 异步 便 件 事件 ， 你 在 写作 业 时 收 到 的 新 邮件 提醒 是 异 
步 软件 事件 ， 

系统 可 能 既 有 同步 事件 又 有 异步 事件 。 例如， 硬件 采用 轮 询 方式 (同步 ) 来 检测 事件 ， 并 
产生 异步 软件 事件 . 

现在 我 们 已 经 准备 好 讨论 程序 执行 中 的 不 连续 性 了 ， 这 包含 3 种 形式 : 中断、 骨 常 和 陷入 。 

1. P E 

中 断 是 设备 引起 处 理 需 注意 的 机 制 。 这 对 于 执行 中 的 程序 来 说 ， 是 一 种 计划 外 的 不 连续 
性 ， 与 处 理 器 的 执行 是 异步 的 。 而 且 ， 设 备 VO 可 能 会 执行 一 个 与 当前 正在 执行 程序 完全 不 
同 的 程序 。 为 了 简单 起 见 ， 我 们 认为 中 断 特 指 由 外 部 设备 引起 的 不 连续 性 。 

2. 异常 

程序 有 时 候 会 不 小 心 执 行 一 些 非法 指令 (比如 ， 除 以 零 ) 或 者 执行 路 径 与 预想 的 不 同 。 这 
些 情况 下 ， 必 须 打 断 原 有 指令 序列 的 执行 ， 处 理 这 个 计划 外 的 不 连续 性 。 这 种 情况 称 为 异 第 。 
异常 是 内 部 产生 的 情况 ， 而 且 与 处 理 需 执行 是 同步 的 。 异 常 一 般 由 当前 程序 引起 ,通常 是 执行 
中 某 些 错误 情况 的 结果 。 然 而 ， 诸 如 Java 这 样 的 编程 语言 定义 了 异常 机 制 ， 人 允许 错误 在 软件 的 
各 层 中 传播 。 在 这 种 情况 下 ， 程 序 可 以 有 意 地 产生 异常 作为 非 预期 程序 行为 的 信号 。 在 这 两 种 
情况 下 ， 我 们 定义 异常 为 一 些 脱离 程序 正常 执行 轨迹 的 情况 (无 论 是 故意 还 是 无 意 的 )。 

3. BA 

程序 通常 通过 系统 调用 来 读 / 写 文件 或 请 求 其 他 系统 服务 。 系 统 调用 类 似 于 过 程 调用 ， 
但 需要 专门 的 处 理 ， 因 为 用 户 程序 会 访问 系统 的 某 些 部 分 ， 这 些 部 分 不 仅 与 当前 程序 有 关 ， 
还 关系 到 系统 的 所 有 用 户 。 而 且 ， 用 户 并 不 知道 与 此 服务 相关 的 过 程 位 于 内 存 何 处 但 在 调用 
时 必须 知道 这 个 信息 。 陷 人 ， 顾 名 思 义 ， 人 允许 程序 往 下 掉 进 操作 系统 中 ， 然 后 由 操作 系统 来 
确定 用 户 程 序 做 什么 。 在 计算 机 著作 中 还 常用 术语 软件 中 断 来 指 代 程序 产生 的 陷入 。 为 了 我 
们 讨论 的 目的 ， 我 们 认为 软件 中 断 与 陷入 等 价 。 与 异常 类 似 ， 陷 入 是 内 部 产生 的 状况 ， 并且 
是 与 处 理 器 执行 同步 的 。 有 的 陷入 是 有 意 的 一 一 例如 ,程序 显 式 地 进行 的 系统 调用 。 我 们 关 
心 的 是 程序 ， 从 这 个 角度 来 说 ， 有 些 陷入 是 无 意 的 。 我 们 在 后 面 讨 论 存储 系统 的 章节 中 会 看 
到 这 类 无 意 陷入 的 例子 。 

许多 著作 中 对 术语 中 断 的 表述 相当 标准 一 致 ， 但 是 对 另外 两 个 术语 就 不 是 这 样 了 。 我 们 
对 这 3 个 术语 的 定义 和 使 用 在 全 书 中 保持 一 致 ， 但 不 保证 与 其 他 书 一 样 。 具 体 来 说 ， 在 我 们 
的 定义 中 ， 陷 入 指 的 是 当前 运行 的 应 用 程序 自己 无 法 处 理 的 一 种 内 部 情况 ， 只 能 由 操作 系统 
处 理 。 另 一 方面 ， 异 常 的 处 理由 当前 运行 的 程序 负责 。 
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表 4-1 总 结 了 这 3 种 程序 不 连续 性 的 特征 。 第 二 列表 示 它 们 是 同步 还 是 异步 ， 第 三 列 给 
出 了 了 不 连续 性 来 目 于 当前 运行 程序 的 外 部 还 是 内 部 ， 第 四 列表 示 不 连续 性 的 来 源 是 和 否 故 意 产 
生 了 它 ， 最 后 一 列 给 出 了 这 种 类 型 的 例子 。 


表 4-1 程序 不 连续 性 


类 型 | 同步 / 别 步 | B | 有意 | 例子 

异常 溢出 、 除 以 零 、 非 法 内 存 地 址 、Java 的 异常 机 制 
陷入 内 部 系统 调用 、 软 件 中 断 、 页 错误 、 仿 真 指令 
i VO 设备 完成 





4.2 ”处 理 程序 不 连续 性 


事实 证 明 ， 程 序 的 不 连续 性 是 一 种 有 力 的 工具 。 第 一 ， 它 允许 计算 机 系统 提供 输入 / 输 
出 功能 。 第 二 ， 它 允许 计算 机 系统 为 相互 竞争 的 活动 管理 资源 。 第 三 ， 它 允许 计算 机 系统 帮 
助 程序 员 开发 正确 的 程序 。 中 断 、 陷 入 和 异常 分 别提 供 了 上 述 功能 。 

处 理 程序 不 连续 性 是 处 理 器 体系 结构 和 操作 系统 之 间 的 一 种 合作 。 我 们 先 来 理解 这 个 分 工 . 
检测 程序 的 不 连续 性 是 处 理 器 的 责任 。 引 导 处 理 器 去 执行 处 理 不 连续 性 的 代码 则 是 操作 系统 的 
责任 。 正 如 我 们 将 在 本 书 中 看 到 的 那样 ， 各 个 子 系统 都 需要 这 种 硬件 和 软件 的 合作 来 支撑 。 

现在 我 们 指出 处 理 程序 不 连续 性 要 做 什么 。 准 确 地 说 ， 就 是 硬件 隐 式 完成 的 活动 和 操作 
系统 显 式 完成 的 活动 。 

事实 证 明 ， 无 论处 理 哪 种 不 连续 性 ， 处 理 器 要 做 的 事情 基本 上 都 是 一 样 的 。 需 要 强调 的 是 ， 
处 理 器 只 执行 指令 。 为 了 处 理 这 些 程序 的 不 连续 性 ， 处 理 器 需要 执行 的 指令 并 不 是 当前 正在 执 
行 的 。 出 现 不 连续 时 执行 的 过 程 就 称 为 处 理 过 程 。 处 理 过 程 的 代码 和 其 他 过 程 的 代码 非常 相像 。 
在 这 个 意义 上 ， 不 连续 性 非常 像 过 程 调用 。( 见 图 4-1 ) 然而 ， 它 是 计划 外 的 过 程 调用 (取决 于 
不 连续 性 的 性 质 )。 此 外 ,我 们 也 必须 观察 这 种 计划 外 过 程 调 用 的 约定 (过程 调用 惯例 ) 以 及 它 
如 何 恢复 正常 的 程序 执行 。 其 中 大 部 分 都 很 简单 ， 就 与 普通 的 过 程 调用 返回 一 样 。 

不 连续 性 有 4 点 很 狐 独 的 地 方 : 

1 ) 它们 可 以 在 指令 执行 的 任意 位 置 发 生 。 因 此 ， 不 连续 性 可 能 发 生 在 指令 执行 的 中 间 。 

2) 不 连续 性 是 计划 外 的 ， 并 且 与 当前 程序 毫 Se 
无 关联 。 所 以 ,硬件 在 将 控制 权 交 给 处 理 过 程 之 
前 ,需要 保存 程序 计数 器 的 值 。 EEE 

3 ) 在 检测 到 不 连续 性 时 ， 硬 件 需 要 确定 处 理 a, ae 
过 程 的 地 址 以 便 将 控制 权 交 给 它 。 开始 

4) 因为 硬件 隐 式 地 保存 PC 值 ， 所 以 处 理 过 : WE | mm a $ 
程 需要 懂得 如 何 恢复 之 前 的 程序 执行 。 

操作 系统 与 处 理 器 体系 结构 之 间 的 合作 使 得 
前 面 4 个 问题 的 解决 成 为 可 能 。 这 个 合作 的 基础 






返回 


ph 原始 程序 al 
在 于 一 个 数据 结构 ， 它 由 操作 系统 维护 ， 保 存在 ests 中 


内 存 中 的 某 处 ， 处 理 器 也 知道 这 个 数据 结构 。 这 
个 数据 结构 是 一 个 固定 大 小 的 处 理 过 程 地 址 表 。 图 4-1 程序 不 连续 性 。 程 序 不 连续 性 与 普通 
表 中 的 每 一 项 对 对 应 于 一 种 预期 的 程序 不 连续 的 过 程 调用 之 间 有 相同 点 也 有 不 同 点 
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性 。( 见 图 4-2.) 表 的 大 小 与 体系 结构 有 关 。 历 史上 ， 这 个 数据 结构 的 名 字 叫 做 中 断 向 量 表 
(IVT) 每 种 不 连续 性 都 有 一 个 唯一 的 编号 ， 通 常 称 为 矢量 。 这 个 编号 用 作 IVT 的 唯一 索引 。 
操作 系统 在 启动 时 建立 这 张 表 。 这 是 为 处 理 程序 不 连续 性 做 准备 的 显 式 部 分 。 表 建 好 后 ， 处 理 
从 在 执行 普通 程序 时 大 检测 到 不 连续 性 ， 就 用 这 张 表 来 查找 特定 处 理 过 程 的 地 址 。 





0 | 际 零 异常 处 理 过 程 地 址 除 零 异常 处 理 过 程 代码 


与 异常 有 关 的 表 项 
1 | 算术 溢出 处 理 过 程 地 址 
. Ean 系统 调用 陷入 处 理 过 程 
: 与 陷入 有 关 的 表 项 代码 


页 错误 陷入 处 理 过 程 


算术 溢出 处 理 过 程 代码 





页 错误 陷入 处 理 过 程 
代码 


地 址 

. | 键盘 中 断 处 理 过 程 地址 

与 外 部 中 断 有 关 的 表 项 | 键盘 中 断 处 理 过 程 代码 
鼠标 中 断 处理 过 程 地 址 


图 4-2 中断 向 量 表 (IVT) 一 一 在 启动 时 OS 建立 这 张 表 。 这 保证 了 当 程 序 发 生 不 连续 时 ， 
人 硬件 能 够 通过 查询 这 张 表 确定 应 该 去 “哪里 ” 


对 于 陷入 和 异常 的 情况 ,硬件 内 部 产生 它们 的 矢量 。 我 们 引入 弄 常 /陷入 寄存 器 (ETR), 
它 位 于 处 理 器 内 部 ， 用 于 保存 这 个 矢量 OLA 4-3 )。 遇 到 异常 或 陷入 时 ， 与 该 异常 或 陷 人 相 
关 的 唯一 编号 就 会 放 人 ETR 中 。 例 如 ， 当 检测 到 “ 除 以 零 ” 这 个 异常 时 ， 除 法 指令 的 FSM 
就 会 将 该 异常 对 应 的 矢量 放 到 ETR 中 。 类 似 地 ， 系 统 调 用 由 处 理 右 支持 的 “陷入 指令 ”产生 。 
在 这 种 情况 下 ， 陷 入 指令 的 FSM 将 对 应 系统 调用 的 矢量 放 入 ETR 中 。 


异常 /陷入 编号 ETR 


图 4-3 异常 /陷入 寄存 器 一 一 由 处 理 咒 在 检测 到 异常 或 陷入 时 设置 ， 用 于 在 IVT 中 索引 
处 理 过 程 地 址 


总 之 ， 操 作 系 统 与 硬件 之 间 为 处 理 程序 不 连续 性 而 进行 的 合作 如 下 : 

1 ) 体系 结构 定义 一 系列 异常 和 它们 对 应 的 编号 (矢量 值 )。 这 些 通常 是 程序 运行 中 的 运 
行 时 错误 (比如 ,算术 洲 出 和 除 以 零 )。 

2 ) 操作 系统 定义 一 系列 异常 (软件 中 汤 ) AA (RSI AD) 以 及 它们 的 编号 (矢量 值 )。 

3 ) 在 启动 时 操作 系统 建立 IVT， 给 出 处 理 各 类 异常 、 陷 入 、 中 断 的 处 理 过 程 地 址 。 

4) 在 普通 程序 执行 时 ， 硬 件 检 测 异常 和 陷入 ， 并 将 它们 的 矢量 值 填 入 ETR。 

5) 在 普通 程序 执行 时 ， 硬 件 检测 外 部 中 断 并 接收 中 断 设 备 对 应 的 天 量 值 。 

6 ) 硬件 使 用 矢量 值 来 索引 IVT， 找 到 处 理 过 程 ， 将 控制 权 从 当前 执行 的 程序 转交 给 处 理 


晶 不 同 厂商 对 该 数据 结构 的 命名 不 同 。Intel 称 之 为 中 断 描 述 符 表 (IDT)， 有 256 个 表 项 。 
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过 程 。 

对 于 外 部 中 断 ， 处 理 融 需要 做 额外 的 工作 才能 确定 与 中 断 设 备 相 对 应 的 矢量 ， 以 便 调 用 
恰当 的 设备 处 理 程序 。4.3 节 讨 论 为 了 处 理 程序 不 连续 性 而 对 处 理 器 体系 结构 和 指令 集 设 计 进 
行 的 改进 . 


4.3 ”处理 程序 不 连续 性 的 体系 结构 改进 


首先 我 们 理解 为 了 处 理 程序 的 不 连续 性 ， 需 要 哪些 体系 结构 上 的 改进 。 因 为 对 于 各 种 类 
型 的 不 连续 性 ， 处 理 需 的 处 理 机 制 是 一 样 的 ， 所 以 今后 我 们 就 用 中 断 来 指 代 不 连续 性 。 

1) 处 理 带 什么 时 候 应 该 处 理 中 断 ” 这 正 是 教室 比喻 中 的 问题 。 我 们 需要 让 处 理 器 在 进入 
处 理 过 程 之 前 是 一 个 干净 的 状态 。 即 使 中 断 发 生 在 某 条 指令 执行 的 中 间 ， 处 理 器 也 应 该 等 这 
条 指令 执行 完成 后 才 检 查 中 断 . 

2) 处 理 需 如 何 发 现 有 中 断 ” 我 们 将 在 处 理 器 数据 通路 的 总 线 中 加 入 硬件 线路 。 在 每 条 指 
令 执 行 完毕 后 ， 处 理 需 在 这 条 线 上 采样 检查 是 否 有 中 断 等 待 处 理 。 

3 ) 我 们 如 何 保存 返回 地 址 ?我们 如 何 创建 处 理 过 程 的 地 址 ”对 于 所 有 指令 ， 如 果 在 指令 
执行 末尾 出 现 了 中 断 ， 则 该 指令 的 FSM 进入 一 个 特殊 的 宏 状态 ，INT 宏 状态 . 

4) 我 们 如 何 处 理 多 个 级 联 的 中 断 ? 我 们 将 在 4.3.3 节 讨 论 这 个 问题 

5) 我 们 如 何 从 中 断 中 返回 ? 我们 将 在 4.3.4 节 中 给 出 这 x 个 问题 的 想法 。 


4.3.1 修改 FSM 


在 第 3 章 中 ,我 们 讨论 了 实现 处 理 器 的 基本 FSM 包含 3 个 安 状 态 一 一 取 指 (fetch)、 解 码 
(decode), #447 (execute)， 如 图 4-4a 所 示 . 

图 4-4b 显示 了 修改 后 的 FSM， 它 多 了 一 个 新 的 宏 状 态 ， 用 于 处 理 中 断 。 正 如 4.2 节 提 到 
的 ， 中 断 可 能 在 当前 指令 执行 的 任意 时 刻 产 生 。 现 在 的 FSM 在 一 条 指令 结束 时 检查 是 否 有 中 
Wr. Weg Pi (INT=y)， 则 FSM 转移 到 INT ZARA; 如 果 没 有 中 断 (INT=n)， 则 返回 到 
Fetch BAKA, 开始 执行 下 一 条 指令 。 有 一 种 可 能 是 在 每 个 宏 状 态 后 进行 检查 。 这 类 比 于 教室 
中 的 教授 先 完成 了 他 的 思考 才 意 识 到 有 学 生 有 问题 。 然 而， 在 每 个 宏 状 态 后 检查 中 断 是 有 问 
题 的 。 在 第 3 章 中 ,我 们 看 到 处 理 硕 数据 通路 中 BALNEA 令 集 体系 结构 层次 不 可 
见 的 内 部 寄存 器 。 我 们 知道 ， 当 指令 执行 完 后 ， 这 些 内 部 寄存 需 的 值 就 无 用 了 。 因 此 ， 将 中 
断 检 查 推 迟到 当前 指令 完成 后 能 使 处 理 器 处 于 干净 的 状态 。 为 了 让 被 中 断 的 程序 能 够 在 处 理 
完 中 断后 恢复 执行 ， 有 两 个 东西 是 必需 的 : 程序 可 见 寄存 咒 的 状态 和 程序 恢复 点 。 


© (ont) 


$k0 ~€— PC 
PC ~ new PC 
a) Abs AR AY EAS FSM b) 为 处 理 中 断 而 修改 的 FSM 如 果 有 中 断 ， 则 处 理 器 在 当 
前 指令 完成 后 进入 中 断 状态 









| 4-4 FSM 
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考虑 下 面 的 程序 : 


100 ADD 
101 NAND 
102 LW 
103 NAND 
i04 BEQ 
当 处 理 器 执行 ADD 指令 时 发 生 了 一 个 中 断 。 为 了 能 够 在 中 断后 恢复 程序 ， 需 要 记 下 的 PC 值 是 
多 少 ? 
=. 


虽然 中 断 是 在 ADD 指令 执行 过 程 中 产生 的 ， 但 它 会 在 指令 执行 完毕 后 才 被 处 理 。 所 以 为 了 能 在 中 
断后 恢复 程序 ， 需 要 记 下 的 PC 值 为 101。 


现在 我 们 讨论 在 INT 宏 状 态 中 需要 做 什么 。 为 了 让 讨论 更 具体 ， 我 们 对 LC-2200 AHAS 
进行 改进 以 便 处 理 中 断 。 

1 ) 我 们 需要 将 当前 PC 值 保 存在 某 处 。 我 们 为 此 保留 一 个 寄存 器 $k0 (寄存 需 堆 中 的 12 
号 通用 寄存 器 )。INT 宏 状态 将 PC TFA $k0。 

2) 我 们 从 设备 接收 到 处 理 过 程 的 地 址 ， 将 其 疾 入 PC， 然 后 转移 到 Fetch BAKA. FAVE 
快 就 会 详细 闻 述 完成 这 步 的 细节 。 


4.3.2 一 个 简单 的 中 断 处 理 过 程 


图 4-5 展示 了 一 个 简单 的 中 断 处理 过 程 。 保 存 和 恢复 处 理 硕 的 寄存 融 与 第 2 间 中 讨论 的 
过 程 调用 约定 极为 类 似 。 


Handler: 
save processor registers; 
execute device code; 
restore processor registers; 


return to original program; 





图 4-5 一 个 简单 的 中 断 处 理 过 程 





考虑 下 面 的 程序 


100 ADD 
101 NAND 
102 LW 
103 NAND 
104 BEQ 


在 处 理 器 执行 ADD 指令 时 发 生 了 一 个 中 断 。 这 时 ， 程序 使 用 的 寄存 器 只 有 R2、R3 和 R4。 中 断 处 
理 器 过 程 保存 和 恢复 的 寄存 器 是 哪些 ? 
x. 


很 不 幸 ， 因 为 中 断 可 能 在 任意 时 刻 发 生 ， 所 以 中 断 处 理 过 程 无 法 知道 程序 现在 使 用 了 什么 寄存 器 。 
所 以 ， 它 保存 或 恢复 所 有 程序 可 见 的 寄存 器 ， 即 使 该 程序 仅仅 需要 保存 或 恢复 R2、R3 和 R4, 
4.3.3 ”处 理 级 联 中 断 


图 4-5 给 出 的 简单 处 理 过 程 代码 有 一 个 问题 。 如 果 在 处 理 当 前 中 汤 时 又 发 生 了 为 一 个 中 
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Wi, ABA FAM ws ADE EY PC 值 (现在 在 $kO 中 )。 这 会 导致 无 法 返回 到 引起 第 一 个 
中 断 的 厚 始 程序 中 。 图 4-6 描述 了 这 种 情况 . 


SkO 下 二 原始 程序 的 返回 地 址 







原始 程序 


$kO < 第 一 个 中 断 处 理 过 程 
的 返回 地 址 


第 二 个 中 断 处 


理 过 程 


图 4.6 级 联 中 断 。 因 为 返回 地 址 保存 在 SkO 中 ， 所 以 租 套 中 断 会 丢失 引起 第 一 个 中 断 的 
原始 程序 的 返回 地 址 


在 进入 第 二 个 中 断 处 理 过 程 时 ， 我 们 就 丢失 了 原始 程序 的 返回 地 址 。 这 种 情况 就 好 像 教 
授 在 回答 完 第 一 个 问题 前 又 要 回答 第 二 个 问题 。 在 这 个 比喻 中 ,我 们 简单 地 禁止 学 生 在 第 一 
个 问题 回答 完 之 前 再 次 提问 。 但 也 许 需要 很 好 地 回答 第 二 个 问题 才能 帮助 大 家 理解 原始 问题 。 
所 以 不 接受 多 个 中 断 对 于 计算 机 系统 来 说 是 不 可 行 的 。 各 个 设备 的 速度 锭 异 ， 比 如 人 硬盘 的 数 
据 速 率 就 要 比 键盘 或 鼠标 高 许多 。 所 以 ,我 们 不 能 在 处 理 一 个 中 断 时 关闭 其 他 中 断 。 同 时 ， 
每 个 处 理 过 程 都 需要 有 一 段 无 新 中 断 的 时 间 ， 这 样 才能 采取 措施 避免 出 现 图 4-6 的 情况 。 

所 以 ， 为 了 处 理 级 联 中 断 ， 需 要 两 个 东西 : 

1 ) 关闭 中 断 的 新 指令 ， 称 为 禁止 中 断 (disable interrupt) 。 

2) 打开 中 断 的 新 指令 ， 称 为 允许 中 断 (enable interrupt), 

而 且 ， 硬 件 需要 在 INT 宏 状 态 中 隐 式 地 关闭 中 断 并 将 控制 权 交 给 处 理 过 程 。 图 4-7 展示 
了 修改 后 的 FSM， 其 中 禁止 中 断 已 添加 到 INT RARS E. 


$k0 -< 一 PC 
PC -< 一 new PC 
Disable 





图 4-7 添加 了 关闭 中 断 指 令 的 修改 后 的 FSM。 硬件 在 将 控制 权 交 给 中 断 处 理 程序 之 前 先 
关闭 中 断 


现在 让 我 们 来 研究 处 理 过 程 应 该 做 什么 才能 避免 出 现 图 4-6 中 的 情况 。 处 理 过 程 将 原始 
程序 的 返回 地 址 保存 在 $k0 中 ， 此 时 中 断 是 关闭 的 。 这 一 步 完成 之 后 ， 它 就 打开 中 断 ， 保 证 
处 理 器 不 会 错过 更 重要 的 中 断 。 在 离开 处 理 过 程 之 前 ， 它 恢复 $k0， 此 时 中 断 也 是 关闭 的 。 
图 4-8 展示 了 修改 后 的 中 断 处 理 过 程 。 如 第 2 章 讨 论 的 过 程 调用 惯例 ， 保 存 和 恢复 寄存 器 都 
使 用 栈 。 
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Handler: 
* 在 进入 处 理 过 程 时 ， 中 断 是 关闭 的 */ 
save $k0; 
enable interrupts; 
Save processor registers; 
execute device code; 
restore processor registers; 
disable interrupts; 
restore $kO; 





return to original program; 


图 4-8 ”修改 后 的 中 断 处 理 过 程 。 处 理 过 程 在 返回 地 址 保存 好 后 ， 立 即使 用 新 指令 显 式 地 
允许 中 新 


考虑 下 面 的 程序 : 


100 ADD 
101 NAND 
102 LW 
103 NAND 
104 BEQ 
在 处 理 器 执行 ADD 指令 时 发 生 了 一 个 中 断 。 处 理 该 中 断 的 处 理 过 程 代 码 如 下 : 
1000 Save $kO 
1001 Enable interrupts 
1002 /* next several instructions save processor registers */ 
1020 /* next several instructions execute device code */ 
1102 /* next several instructions restore processor registers */ 
1120 restore $kO 
1121 return to original program 
假设 在 指令 “restore $k0” (PC=1120 ) 处 产生 了 一 个 中 断 ， 那 么 原始 程序 什么 时 候 恢 复 呢 ? 
=. 


原始 程序 永远 都 不 会 恢复 。 注 意 第 二 个 中 断 在 “restore $k0” 完 成 后 马上 被 处 理 ， 此 时 处 理 过 程 有 
$k0=101， 这 正 是 原始 程序 的 恢复 点 。 现 在 出 现 了 第 二 个 中 断 。 不 幸 的 是 ， 第 二 个 中 断 ( 见 图 4-7 ) 将 第 
一 个 中 断 处 理 过 程 的 恢复 点 (内 存 地 址 为 1121 ) 保存 到 $k0 中 。 因 此 ， 原 始 程序 的 恢复 点 (内 存 地 址 为 
101) 就 永远 丢失 了 。 究 其 原因 是 本 例 中 的 中 断 处 理 过 程 没 有 图 4-8 中 的 关键 的 “禁止 中 断 ” 指 令 。 


需要 注意 的 是 ， 并 不 是 所 有 情况 在 处 理 第 一 个 中 断 时 都 需要 这 么 谨慎 地 处 理 第 二 个 中 断 ，。 
例如 ， 在 4.4.1 节 中 我 们 将 介绍 多 层 中 断 的 概念 。 根 据 它们 的 相对 速度 ,设备 会 有 不 同 的 中 断 
优先 级 。 例 如 ， 与 键盘 之 类 的 低速 设备 相 比 ， 硬 盘 这 样 的 高 速 设备 就 有 更 高 的 优先 级 。 当 处 
理 器 在 处 理 来 自重 盘 的 中 断 时 ， 它 会 暂时 忽略 来 自 键盘 的 中 断 。 

硬件 的 角色 是 为 处 理 器 正确 处 理 级 联 中 断 提 供 必 要 的 机 制 。 处 理 过 程 代 码 ( 它 是 操作 系 
统 的 一 部 分 ) 与 处 理 器 硬件 的 合作 关系 决定 了 如 何 最 好 地 处 理 多 个 同时 发 生 的 中 断 ， 这 依赖 
于 这 个 时 间 点 处 理 右 正在 做 什么 。 

基本 上 ， 我们 的 选择 包括 两 部 分 : 

。 在 一 段 时 间 内 忽略 中 断 ( 当 操 作 系统 正在 处 理 一 个 更 高 优先 级 的 中 断 时 )。 
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暂时 忽略 中 断 可 以 是 硬件 优先 级 保证 的 隐 式 操作 ， 也 可 以 是 处 理 过 程 通过 “禁止 中 断 ” 
指令 进行 的 显 式 操作 . 


43.4 从 处 理 过 程 中 返回 


当 处 理 过 程 完成 后 ， 它 能 使 用 存储 在 $k0 中 的 PC 值 返 回 到 原始 程序 。 乍 一 看 ， 为 了 支持 
从 中 断 返 回 ， 需 要 提供 过 程 调用 机 制 。 例 如 ， 在 第 2 章 中 。 为 了 从 过 程 中 返回 ,我们 引入 了 
下 面 的 指令 9: 

J rlink 

自然 地 ， 我 们 企图 使 用 相同 的 指令 从 中 断 返 回 : 

J S$k0 

然而 ， 这 有 一 个 问题 。 我 们 在 返回 原始 程序 时 中 断 应 该 是 打开 的 。 所 以 ,我们 应 该 考虑 
使 用 下 面 的 指令 序列 从 中 断 返 回 : 


Enable interrupts; 
J S$k0; 


使 用 上 面 的 指令 序列 依然 存在 问题 。 我 们 在 每 条 指令 结束 后 应 该 检查 中 断 。 所 以 ,在 
“Enable Interrupts ” a “J Sk0” 两 条 指令 的 中 间 ， 可 能 会 发 生 新 的 中 断 而 废弃 $k0 的 值 。 

因此 ,我们 引入 下 面 的 新 指令 : 

Return from interrupt (RETI) 

这 条 指令 的 语义 是 : 


Load PC from $k0; 
Enable interrupts; 


需要 特别 注意 的 一 点 是 ， 这 条 指令 是 原子 的 。 也 就 是 说 ， 在 该 指令 执行 完 之 前 不 会 有 新 
的 中 断 产 生 。 有 了 这 条 新 指令 ， 图 4-9 给 出 了 正确 的 能 够 处 理 藤 套 中 断 的 处 理 过 程 。 


Handler: 
上 旋 进 入 处 理 过 程 时 ， 中 断 是 关闭 着 的 */ 
save $k0; 
enable interrupts; 
save processor registers; 
execute device code; 


restore processor registers; 
disable interrupts; 

restore $kO; 
return from interrupt; 


/* 从 中 断 返 回 会 打开 中 断 */ 





图 4-9 完整 的 中 断 处 理 过 程 


43.5 ”检查 点 


总 之 ,我 们 为 了 使 LC-2200 能 够 处 理 中 断 ， 我 们 对 体系 结构 做 了 如 下 改进 。 
1 ) LC-2200 中 新 增 了 下 面 三 条 指令 : 


© LC-2200 没有 单独 的 无 条 件 跳 转 指令 - 因此 在 LC-2200 中 我 们 使 用 JALR 来 模拟 它 . 
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Enable interrupts 
Disable interrupts 
Return from interrupt 


2) 当中 断 发 生 时 ， 将 当前 PC 值 隐 式 地 存储 到 专用 寄存 器 $k0 中 。 

现在 我 们 转 问 讨论 支持 这 些 体系 结构 改进 所 需要 的 硬件 。 我 们 已 经 给 出 了 宏 状 态 层 上 FSM 
的 改进 细节 。 我 们 给 读者 留 一 个 练习 ， 解 决 LC-2200 数据 通路 下 INT 宏 状态 的 细节 问题 。 为 了 完 
成 这 个 练习 ， 读 者 需要 识别 完成 INT 宏 状 态 需 要 哪些 微 状态 ， 并 给 出 各 微 状态 下 的 控制 信号 。 


44 ”处 理 程序 不 连续 性 的 硬件 细节 


正如 我 们 在 42 节 中 提 到 的 那样 ， 目 前 讨论 的 体系 结构 改进 都 与 具体 的 不 连续 性 类 型 ( 即 
异常 、 陷 入 、 中 断 ) 无 关 。 在 本 节 中 ， 我 们 将 从 整体 上 讨论 处 理 程序 不 连续 性 的 硬件 细节 ， 并 
具体 讨论 外 部 中 断 处 理 。 我 们 已 经 介绍 了 中 断 向 量 表 OVT) 和 异常 /陷入 寄存 器 (ETR) RI 
现在 研究 为 了 能 够 从 外 部 设备 接收 中 断 向 量 ， 数 据 通路 需要 做 哪些 改进 。 我 们 有 意 保持 简单 的 
讨论 ， 而 实际 上 现代 处 理 器 中 的 中 断 体系 结构 是 非常 复杂 的 ， 我 们 在 本 章 小 结 中 会 简单 介绍 - 


4.4.1 中 断 的 数据 通路 细节 


我 们 将 讨论 处 理 中 断 的 实现 细节 。 在 第 3 曹 中， 我 们 介绍 并 讨论 了 连接 数据 通路 各 元 件 
的 总 线 这 一 概念 。 我 们 来 扩展 这 个 概念 ， 这 对 于 理解 数据 通路 为 处 理 中 断 进行 的 扩展 是 非常 
必要 的 。 特 别 地 ， 我们 设想 这 样 一 条 总 线 ， 它 把 处 理 右 和 内 存 、 外 部 IO 设备 连接 起 来 。 为 
了 让 处 理 带 和 内 存 通 信 ， 我 们 需要 地 址 线 和 数据 线 。 图 4-10 中 的 数据 通路 在 总 线 上 添加 了 额 
外 的 线路 来 支持 中 断 。 总 线 上 有 一 条 标记 为 INT 的 线 。 所 有 和 希望 中 断 CPU 的 设备 都 断言 该 
线 。 在 第 3 章 中 ,我 们 强调 了 保证 任意 时 刻 至 多 只 有 一 个 元 件 访问 共享 总 线 的 重要 性 。 另 一 
方面 ，INT 线 却 不 一 样 。 可 以 有 任意 数量 的 设备 同时 断言 该 线 ， 表 明 它 们 想 和 处 理 需 通话 (就 
像 教室 里 有 许多 学 生 同 时 举 手 一 样 )。 为 了 能 够 让 多 个 设备 同时 断言 INT 线 ,这 里 采用 了 一 种 
称 为 线 或 ( wired-OR) 的 技术 。( 该 技术 的 细节 已 经 超出 了 本 书 的 范围 ， 感 兴趣 的 读者 可 以 参 
考 关于 逻辑 设计 的 教材 (如 [Katz，2004; Mano, 2007; Patt2004]) 以 了 解 更 多 细节 。 ) 


地 址 总 线 





图 4-10 ”针对 中 断 处 理 的 数据 通路 改进 。 所 有 的 设备 通过 “ 线 或 ”方式 连接 到 INT 线 上 。 
从 处 理 需 发 出 的 INTA 线 依次 穿 过 所 有 设备 ( 称 为 菊 链 )。 如 果 多 个 设备 同时 中 
世 处 理 融 ， 则 在 电气 上 最 接近 处 理 带 的 中 断 设 备 优先 处 理 。 被 选中 的 设备 将 “ 辣 
量 ” 放 在 数据 总 线 上 


在 中 断 发 生 时 ， 处 理 器 对 INTA 线 断 言 (在 INT 宏 状 态 中 )。 尽 管 可 能 有 多 个 设备 希望 中 
新 寄存 器 ， 但 只 能 有 一 个 设备 得 到 确认 。 注 意 INTA 线 ， 它 并 不 是 共享 线 ( 像 INT 线 那样 )， 
而 是 从 一 个 设备 到 另 一 个 设备 的 链 ， 通 常 称 为 薪 链 。 电 气 上 距离 最 近 的 设备 (图 4-10 中 的 设 
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备 1) 最 先 得 到 INTA 信号 。 如 果 它 有 中 断 请 求 ， 则 它 知 道 处 理 器 已 经 准备 好 和 它 进行 通话 
了 。 如 果 它 没有 中 断 请 求 ， 则 它 知 道 有 其 他 设备 正在 等 待 与 处 理 器 通话 ， 于 是 它 将 INTA 信 
号 通过 链 传递 下 去 。 菊 链 的 优点 是 简单 ， 但 却 需要 护 受 确认 信号 传播 给 中 断 设备 的 延迟 ， 对 
于 如 今 如 此 快速 的 处 理 如 更 是 如 此 。 由 于 这 个 原因 ， 现 代 处 理 器 并 不 使 用 这 种 方法 。 

这 种 设计 原理 的 一 种 推广 是 允许 总 线 上 出 现 多 条 INT 线 和 INTA 线 。 每 对 不 同 的 INT 线 
和 INTA 线 对 应 着 一 个 优先 级 。 图 4-11 表示 了 一 个 8 层 优 先 级 的 中 断 机 制 。 需 要 注意 的 是 ， 
在 这 种 设计 中 ， 某 一 时 刻 依 然 只 能 有 一 个 设备 能 够 与 处 理 需 对 话 (处 理 需 的 INTA 线 连 接 到 有 
中 断 请 求 的 设备 中 优先 级 最 高 的 设备 的 INTA 线 )。 设 备 优先 级 与 设备 速度 有 关 。 设 备 的 速率 
越 快 ， 丢 失 数据 的 可 能 性 越 高 ， 因 此 也 越 需要 得 到 迅速 的 处 理 。 因 此 ， 设 备 根据 它们 的 优先 
级 排 布 在 中 断 线 上 。 人 例如， 硬盘 的 优先 级 比 键盘 高 。 然 而 ， 虽 然 有 多 个 中 断 等 级 ， 但 如 果 每 
个 设备 都 需要 专用 的 中 断 线 ， 那 也 无 法 容纳 所 有 的 设备 。 另 外 ， 根 据 定 义 ， 高 优先 级 的 设备 
比 低 优 先 级 的 设备 重要 。 然 而 ， 有 些 设备 的 速率 相近 ， 因 此 处 于 同一 优先 级 。 比 如 ， 键 盘 和 
鼠标 。 因 此 ， 依 然 有 必要 将 多 个 设备 放 在 同一 优先 级 上 ， 如 图 4-11 所 示 。 


INT 8 
INTA 8 


图 4-11 优先 级 中 断 。 为 了 满足 不 同 速率 设备 的 需要 ， 现 代 计 算 机 系统 有 多 个 优先 级 。 
根据 设备 的 速率 将 它们 排 布 在 不 同 的 优先 级 上 。 每 个 优先 级 内 部 会 有 多 个 设备 
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正如 前 面 所 说 ， 由 于 信和 号 传播 延迟 太 大 ， 菊 链 设 计 并 不 令 人 满意 。 另 外 ， 处 理 需 是 珍 贯 
的 资源 ， 如 今 的 努力 方向 是 将 不 必要 的 工作 从 处 理 器 中 转移 出 去 ， 并 支持 外 部 的 胶合 逻辑 。 
所 以 ， 在 现代 处 理 器 中 ， 决 定 哪个 设备 获得 中 断 响应 这 个 工作 转移 给 了 一 个 外 部 逻辑 ， 称 为 
中 断 控 制 器 。 中 断 控制 器 收集 中 断 请 求 并 选择 优先 级 最 高 的 那个 报告 给 处 理 磊 ， 它 还 处 理 与 
设备 间 基 本 的 信号 交换 。 操 作 系 统 将 一 个 优先 级 内 的 中 断 服务 例 程 用 链表 链接 起 来 ， 而 不 是 
在 硬件 上 在 采用 菊 链 方式 连接 。 现 在 处 理 一 个 中 断 需 要 遍历 链表 以 确定 第 一 个 有 中 断 请 求 的 
设备 并 进行 处 理 。 

你 可 能 想 知 道 这 一 切 与 你 如 何 将 设备 (比如 ， 记 忆 棒 或 耳机 ) 插入 笔记 本 之 间 有 什么 关 
系 。 实 际 上 没有 什么 神奇 的 。 设 备 的 位 置 (以 及 它 的 优先 级 ) 已 经 预先 由 系统 的 VO 体系 结构 
决定 了 ( 见 图 4-11 )， 你 在 外 部 看 见 的 就 是 一 些 可 以 插入 设备 的 插 横 。 我 们 将 在 第 10 章 中 进 
一 步 讨论 计 算 机 总 线 ， 这 与 输入 /输出 有 关 。 


44.2 ”获得 处 理 过 程 地 址 的 细 市 
我 们 现在 来 看 看 处 理 器 如 何 从 外 部 设备 取得 中 断 向 量 。 正 如 4.2 节 中 提 到 的 那样 ， 操 作 
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系统 在 启动 时 建立 的 中 断 问 量 表 (IVT) 包含 了 所 有 外 部 中 断 的 处 理 过 程 地 址 。 虽 然 设备 不 知 
道 它 的 处 理 过 程 代 码 在 内 存 中 的 何 处 ， 但 它 知道 表 项 中 包含 它 。 例 如 ， 键 盘 知道 它 的 中 断 向 
量 为 80， 鼠 标 知 道 它 的 中 断 向 量 为 82 2。 在 收 到 处 理 器 发 送 的 INTA 信号 时 ( 见 图 4-12 )， 设 
备 将 它 的 向 量 放 到 数据 总 线 上 。 需 要 强调 的 是 ， 处 理 需 此 时 还 处 在 INT 宏 状态 。 处 理 需 用 这 
个 向 量 作为 索引 到 回 量 表 中 查找 处 理 过 程 的 地 址 ， 然 后 将 地 址 装 入 PC。 操 作 系 统 为 回 量 表 保 
留 一 块 内 存 区 域 (通常 是 低地 址 内 存 )。 疝 量 表 的 大 小 是 操作 系统 设计 时 的 一 个 选择 。 因 此 ， 
通过 中 断 向 量 表 ， 处 理 器 可 以 间接 得 到 处 理 相 应 中 断 的 处 理 过 程 代码 在 内 存 中 的 地 址 。 
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图 4-12 处理 需 与 设备 的 连接 及 获取 中 断 回 量 。 处 理 硕 从 选中 的 设备 得 到 中 断 问 量 ， 并 
用 它 在 内 存 中 的 IVT 进行 索引 以 得 到 相应 处 理 过 程 代码 的 起 始 地 址 


处 理 器 和 设备 之 间 的 信号 交换 总 结 如 下 : 

1) 无 论 何 时 ， 如 果 设 备 想 中 断 处 理 右 ， 则 对 INT 线 断 言 。 

2) 处 理 器 在 完成 当前 指令 (EXECUTE RIRA ( 见 图 4-4b)) 后 ， 检 查 INT 线 (图 4-4b 
显示 FSM 中 为 INT=y/n) 是 否 有 中 断 请 求 。 

3) 如 果 有 中 断 请 求 ， 即 图 4-4b 的 FSM 中 的 INT=y， 则 处 理 需 进入 INT 宏 状 态 并 将 总 线 
上 的 INTA 线 断 言 。 

4) 设备 在 收 到 处 理 器 发 送 的 INTA 信号 后 ， 把 自己 的 向 量 放 到 数据 总 线 上 (比如 ， 键 盘 
将 它 的 向 量 80 放 上 去 )。 

5) 处 理 器 收 到 向 量 并 在 中 断 向 量 表 中 查找 对 应 的 表 项 。 这 里 我 们 假设 找到 的 处 理 过 程 地 
址 为 0x5000。 这 就 是 处 理 当 前 中 断 所 需要 的 处 理 过 程 的 PC 值 。 

6) 处 理 器 在 INT 宏 状 态 中 完成 上 面 的 动作 后 ， 如 图 4-4b 所 示 ， 将 PC 保存 在 $k0 中 ， 
并 将 中 断 向 量 表 中 取出 的 值 填 人 PC. 


日 ”操作 系统 通常 为 每 个 设备 确定 一 条 表 项 ， 该 表 项 会 被 “编写 ”到 设备 接口 中 。 我 们 在 讨论 输入 /输出 的 第 10 
章 还 会 回 到 这 个 问题 ， 
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44.3 保存 /恢复 栈 


图 4-9 是 处 理 过 程 的 代码 ， 它 包括 保存 和 恢复 寄存 器 的 代码 (与 过 程 调 用 惯例 类 似 )。 栈 
看 起 来 很 明显 就 是 用 来 保存 处 理 融 寄存 器 的 地 方 。 然 而 有 一 个 问题 ， 处 理 过 程 怎 么 知道 要 用 
内 存 的 哪 一 部 分 作为 栈 呢 ? 中 断 可 能 与 当前 运行 的 程序 根本 没关系 。 

鉴于 这 一 点 ， 篆 稼 可 以 见 到 体系 结构 拥有 两 个 栈 : 用 户 栈 和 系统 栈 。 通 常 ， 
指定 某 个 寄存 器 作为 栈 指针 。 在 进入 INT 宏 状 态 时 ，FSM 执行 栈 切 换 。 

现在 我 们 来 看 看 为 了 帮助 完成 栈 切 换 ， 硬 件 需 要 做 哪些 改进 : 

1 ) 复制 栈 指针 : 的 确 ， 我 们 需要 做 的 就 是 复制 体系 结构 指定 作为 栈 指 针 的 寄存 器 。 在 第 
2 章 中 ， 我 们 指派 一 个 寄存 器 Ssp 作为 栈 指针 。 我 们 将 复制 这 个 寄存 器 : 一 个 给 用 户 程序 使 
用 ,为 一 个 给 系统 使 用 。 在 中 断 处 理 过 程 中 保存 的 状态 将 使 用 系统 版 的 $sp。 这 样 保存 状态 就 
不 会 弄 乱 用 户 栈 ， 因 为 所 有 的 保存 和 恢复 都 发 生 在 系统 栈 上 。 在 系统 启动 时 ， 系 统 初 始 化 系 
ee ee 申请 足够 的 空间 来 处 理 中 断 RE PBT ) o 

) 特权 模式 : 要 记 住 中 断 处 理 过 程 其 实 也 就 是 程序 。 我 们 需要 让 人 处理 器 知道 在 某 个 时 刻 
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的 值 处 于 用 户 模式 或 内 核 模式 。 如 果 处 理 器 处 于 用 户 模式 ， 那 么 硬件 就 隐 式 地 使 用 用 户 版 本 
的 $sp。 如 果 处 于 内 核 模 式 ， 则 使 用 内 核 版 的 $sp。FSM Æ INT 宏 状 态 中 设置 该 位 的 值 。 因 
此 ， 处 理 过 程 将 运行 在 内 核 模式 并 使 用 系统 栈 。 在 返回 用 户 程序 前 ，RETI 指令 将 模式 位 设置 
为 “用 户 ” 使 得 用 户 程序 在 恢复 执行 后 能 够 使 用 用 户 栈 。 

模式 位 还 有 一 个 重要 作用 。 我们 引入 了 3 条 新 指令 来 支持 中 断 。 人 允许 所 有 的 程序 执行 这 三 
条 指令 是 不 谨慎 的 。 例 如 ， 寄 存 器 $k0 有 特殊 意义 ， 不 应 该 允许 任意 程序 写 这 个 寄存 硕 。 类 似 
地 ， 也 不 应 该 允许 任意 程序 打开 或 关闭 中 断 。 只 有 操作 系统 能 够 执行 这 些 所 谓 的 特权 指令 。 我 
们 需要 一 种 方法 来 防止 普通 用 户 程 序 意外 地 或 恶意 地 尝试 执行 这 些 特 权 指 令 。 中 汤 处 理 过 程 是 
操作 系统 的 一 部 分 ， 运 行 在 “内 核 ” 模 式 。( FSM 在 NT 宏 状 态 中 将 模式 位 设置 为 “内 核 ”) 
如 果 用 户 程 序 试 图 执行 这 些 指 令 ， 将 会 引发 一 个 非法 指令 陷入 (illegal instruction trap)。 

我 们 需要 指出 男 外 两 个 精妙 的 细节 来 完成 对 于 中 断 处 理 的 讨论 。 首 先 ， 中 断 是 可 以 租 套 
的 。 因 为 所 有 中 断 处 理 过 程 都 运行 在 内 核 


体系 结构 会 


INT macro state: 


模式 ， 只 有 当 处 理 寓 从 用 户 程 序 进入 中 断 
处 理 过 程 时 ， 我们 才 需 要 在 INT 宏 状 态 
中 进行 模式 切换 (以 及 模式 位 引起 的 隐 式 
栈 切 换 )。 而 且 ， 我 们 需要 记 住 处 理 需 当 
前 的 模式 以 便 在 执行 RETI 指令 时 采取 人 恰 
当 的 操作 (需要 返回 用 户 模式 还 是 内 核 模 
式 )。 系 统 栈 是 一 个 记 住 处 理 需 当前 状态 
的 方便 工具 。 

INT 宏 状 态 和 RETI 指令 分 别 将 处 理 器 
当前 模式 压 人 栈 中 或 从 栈 中 弹出 。INT 宏 状 
态 和 RETI 指令 采取 与 处 理 器 当前 状态 相应 
的 行动 。 图 4-13 总 结 了 INT 宏 状 态 中 的 所 
有 操作 ， 图 4-14 总 结 了 RETI 指令 的 语义 。 





$k0 二 PC; 

ACK INT by asserting INTA; 

tp a aes ea 
Retrieve address of the handler from the interrupt vector table; 
PC <handler address retrieved from the vector table; 

Set se 


| od on te eens PES ME) 
Enable interrupts; 


图 4-14 RETI 指令 的 语义 
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4.5.1 体系 结构 和 硬件 改进 总 结 


为 了 处 理 程序 不 连续 性 ， 我 们 对 LC-2200 进行 了 如 下 体系 结构 和 硬件 的 改进 : 

e 一 个 中 断 问 量 表 (IVT)， 由 操作 系统 初始 化 为 各 处 理 过 程 的 地 址 。 

。 一 个 异常 / 陷 人 寄存 器 (ETR), 含有 内 部 产生 的 异常 和 陷入 的 癌 量 。 

© 接收 外 部 中 断 的 癌 量 的 人 硬件 机 制 。 

。 用 户 / 内 核 模 式 和 与 之 相关 的 处 理 融 模式 位 。 

。 与 模式 位 有 关 的 用 户 / 内 核 栈 。 

。 一 个 硬件 机 制 ， 用 于 在 中 断 时 隐 式 地 将 当前 PC 保存 到 特殊 寄存 器 $k0 中 ， 并 利用 癌 量 
(无 论 是 内 部 产生 的 还 是 从 外 部 设备 接收 的 ) 从 IVT 中 检索 处 理 过 程 地 址 。 

e 加 入 LC-2200 的 3 条 新 指令 : 


Enable interrupts 
Disable interrupts 
Return from interrupt 


4.5.2 工作 中 的 中 断 机 制 


我 们 通过 演示 几 个 简单 的 例子 来 将 这 些 概念 综合 到 一 起 ， 让 读者 理解 中 断 机 制 是 如 何 工 
作 的 。 为 了 让 演示 更 加 清楚 ， 我 们 将 系统 版 本 的 Ssp 称 为 SSP， 而 用 户 版 本 的 $sp 称 为 USP。 
然而 ， 在 体系 结构 上 ( 即 从 指令 集 的 角度 来 看 )， 它 们 指 的 是 同一 个 寄存 器 。 硬 件 (通过 模式 
位 ) 知道 使 用 USP 还 是 SSP 作为 $sp。 


ES 四 415a ~ d 给 出 的 例子 展示 了 中 断 处 理 中 相关 的 一 系列 步骤 。 称 为 foo 的 程序 正在 执行 ( 见 图 45a) 

键盘 设备 中 断 了 处 理 器 。 处 理 器 正在 执行 单元 19999 的 指令 。 它 一 直 等 到 当前 指令 执行 完毕 。 然 后 
处 理 器 进入 INT EKA (UL 4-15b) 并 将 当前 PC 值 (20000) HA $k0。 收 到 处 理 器 的 INTA 信号 后 ， 
设备 将 它 的 向 量 放 到 数据 总 线 上 。 处 理 器 通过 数据 总 线 接收 设备 的 向 量 ， 如 图 4-15b。 

我 们 假设 收 到 的 值 是 40。 处 理 器 查找 内 存单 元 40 以 便 获 得 处 理 过 程 地 址 (假设 为 1000 )。 令 SSP 
的 内 容 为 300。 在 INT 宏 状 态 中 , FSM 将 1000 A PC, 将 300 装 入 $sp， 将 当前 模式 保存 在 系统 栈 中 ， 
然后 返回 到 FETCH 宏 状 态 。 位 于 单元 1000 的 处 理 过 程 代码 (类似 于 图 4-9 ) 开始 执行 ， 使 用 $sp=299 
作为 它 的 栈 ( 见 图 4-15c)。 

处 理 过程 从 中 断 返 回 后 ， 原 始 程序 将 在 PC=20000 恢复 执行 OLE 4-15d)。 


or | 
2 








A. 正在 执行 19999 处 的 指令 ，PC 
已 经 递增 ， 设 备 中 断 发 生 在 指令 
中 间 ，5sp 指向 用 户 栈 。 


















ey mee TS ey ” ”原始 程序 
a) 中 断 处 理 (接收 到 中 断 请 求 ) 
图 4-15 中断 处 理 





Pit, KARAS 


B. 发 现 中 断 ，$k0 存 好 PC 值 ， 中 
断 被 关闭 ， 确 认 中 断 ， 设 备 将 中 | _TPEQ | 1 
断 向 量 放 到 总 线 上 。 





系统 栈 


b) 中 断 处 理 (INT 宏 状 态 


C. PC 中 装 入 处 理 过 程 的 地 址 ， 当 
前 模式 存 人 系统 栈 中 ,将 新 的 模 
式 设 为 内 核 模 式 ，$sp 现在 指向 了 
ABR, THE 1000 处 的 代码 来 处 
理 中 断 






INTACK 
INT enable 





处 理 过 程 代 码 原始 程序 
接收 向 量 ) 














处 理 过 程 代码 原始 程序 


c) 中 断 处 理 (转交 控制 权 给 处 理 过 程 代码 ) 


D. RETI 指令 从 系统 栈 中 恢复 模 
式 ， 因 为 本 例 中 是 返回 到 用 户 程 
序 ， 所 以 $sp 现在 指向 了 用 户 栈 。 
将 $k0 复 制 到 PC， 重 新 打开 中 
断 ， 并 设置 模式 为 用 户 模式 。 


d) 中 断 处 理 Gk 


图 4-15 


考虑 如 下 情况 : 
假设 内 存 地 址 是 连续 的 整数 。 
用 户 程序 执行 内 存单 元 7500 的 指令 
用 户 栈 指针 ($sp) 值 为 18000 
SSP 值 为 500 
键盘 的 向 量 为 80 
硬盘 的 向 量 为 50 
键盘 中 断 处 理 过 程 的 地 址 为 3000 
硬盘 中 断 处 理 过 程 的 地 址 为 5000 










处 理 过 程 代码 原始 程序 
回 原始 程序 ) 
( 续 ) 
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a. 将 上 述 信息 用 类 似 图 4-15 的 方式 画 出 。 

b. 键盘 产生 了 一 个 中 断 。 表 示 当 键盘 中 断 处 理 过 程 即将 开始 执行 时 ， 处 理 器 相关 的 状态 (类似 于 图 4-15c)。 

c. 当 键 盘 中 断 处 理 过 程 执行 到 打开 中 断后 ,硬盘 产 生 了 一 个 优先 级 更 高 的 中 断 。 假 设 键 抢 中 断 处 理 
过 程 正在 执行 内 存单 元 3023 的 指令 ， 栈 指针 (Ssp) 值 为 515。 表 示 硬 盘 中 断 处 理 过 程 将 要 开始 执行 时 ， 
处 理 器 的 相关 状态 。 

d. 表示 当 硬 盘 处 理 过 程 执行 RETI 指令 时 ,处理 器 相关 的 状态 (类似 于 图 4-15d)。 

e. 表示 当 键 盘 处 理 过 程 执行 RETI 指令 时 ， 处 理 器 相关 的 状态 (类 似 于 图 4-15d)。 

这 个 例子 留 给 读者 作为 练习 。 


小 结 


在 本 章 中 ， 我 们 介绍 了 一 个 重要 的 概念 ， 中 断 。 这 使 得 处 理 咒 能够 与 外 部 世界 进行 通信 。 
中 断 是 程序 不 连续 性 的 一 种 特定 实例 。 我 们 讨论 了 支持 舱 套 中 断 所 需要 的 最 少 的 硬件 改进 ， 
包括 处 理 妖 内 部 的 和 总 线 层 上 的 。 

。 处理 顺 的 改进 包括 ( 3 条 ) 新 指令 、 用 户 栈 、 系 统 栈 、 模 式 位 以 及 INT 宏 状 态 。 

。 在 总 线 层 上 上， 我们 介绍 了 专门 的 控制 线 ， 称 为 INT 和 JINTA。 这 是 为 了 让 设备 向 处 理 需 

表明 它 想 中 断 处 理 需 并 让 处 理 器 能 够 确认 中 断 。 

我 们 还 回顾 了 陷入 和 异常 ， 它 们 是 同步 的 程序 不 连续 性 。 有 趣 的 是 ， 处 理 这 些 不 连续 性 
所 需要 的 软件 机 制 是 类 似 的 。 我 们 讨论 了 如 何 编写 一 个 能 够 处 理 舱 套 中 断 的 通用 的 中 断 处 理 
过 程 。 

我 们 还 特意 简化 了 本 章 中 中 断 的 表示 ， 便 于 让 第 一 次 上 系统 课程 的 学 生 接 受 。 现 代 处 理 
器 中 的 中 断 机 制 相 当 复 杂 。 人 例如， 现代 处 理 器 将 中 断 分 为 两 类 : 可 屏蔽 的 和 不 可 屏蔽 的 。 

。 前 一 种 指 的 是 能 够 通过 关中 断 机 制 暂 时 关闭 的 中 断 (例如 ， 设 备 中 断 )。 

。 后 一 种 指 的 是 即使 是 关中 断 机 制 也 无 法 关闭 的 中 断 〈 例 如 ， 系 统 检测 到 的 内 部 硬件 错误 )。 

我 们 介绍 了 一 种 机 制 ， 处 理 右 使 用 这 种 机 制 来 找到 中 断 处 理 过 程 的 起 始 地 址 (通过 癌 量 
表 )， 还 有 使 用 专用 寄存 癸 来 保存 被 中 断 程序 的 返回 地 址 。 我 们 还 介绍 了 一 个 简单 的 人 硬件 方 
案 ， 处 理 器 识别 中 断 设 备 的 身份 并 确认 中 断 。 这 些 讨论 的 主要 目的 是 告诉 读者 ， 设 计 这 样 的 
人 硬件 是 简单 而 直观 的 。 

我 们 介绍 了 作为 处 理 咒 内 部 状态 特性 的 模式 。 这 也 是 一 个 故意 简化 的 版 本 。 处 理 天 状态 
可 能 还 有 其 他 一 些 位 表示 其 他 可 用 的 属性 信息 (类似 于 模式 位 )。 通 常 ， 处 理 需 将 所 有 这 些 位 
集合 到 一 个 寄存 器 中 ， 称 为 处 理 器 状态 字 (PSW)。 遇 到 中 断 及 中 断 返 回 时 ， 硬 件 隐 式 地 在 系 
统 栈 上 压 人 和 弹出 PC 和 PSW 5 。 

我 们 还 介绍 了 相当 简单 的 中 断 处 理 过 程 代 码 来 表达 处 理 器 需要 做 什么 才能 应 付 中 断 。 典 
型 的 处 理 过 程 的 工作 远 不 止 保存 处 理 器 的 寄存 器 。 在 后 面 的 章节 中 ， 我 们 将 在 操作 系统 功能 ， 
如 处 理 器 调度 (第 6 章 ) 和 设备 驱动 (第 10 章 ) 中 ,探究 中 断 。 

现代 处 理 器 中 的 中 断 体系 结构 远 比 这 里 给 出 的 复杂 。 首 先 ， 因 为 处 理 器 是 珍贵 的 资源 ， 
所 以 大 量 与 中 断 处 理 有 关 的 事务 ， 除 了 执行 过 程 代 码 之 外 ， 都 放 在 处 理 器 的 外 部 实现 。 例 如 ， 
称 为 可 编程 中 断 控 制 器 (PIC) 的 设备 帮助 处 理 器 应 对 各 种 处 理 外 部 中 断 时 的 细节 ， 包 括 : 

。 应 对 多 个 中 断 级 。 


日 “在 LC-2200 中 ,我 们 指定 一 个 寄存 器 $k0 在 INT 宏 状 态 中 保存 PC。 许多 现代 处 理 器 采取 的 男 一 种 方法 是 


直接 将 PC 保存 在 系统 栈 上 . 


份 。 


PB. BARAR 


。 从 设备 收集 实际 的 中 断 。 

© 在 产生 中 断 的 设备 中 选择 优先 级 最 高 的 设备 。 

。 获 得 被 选中 的 对 处 理 需 发 出 中 断 的 设备 的 号 份 ( 回 量 表 索 引 )。 
。 确认 被 选中 的 设备 。 


PIC 提供 了 处 理 硕 可 谈 的 寄存 硕 ， 其 中 一 个 包含 了 被 选中 辐 处 理 需 发 出 中 断 的 设备 的 续 
使 用 PIC 简化 了 处 理 器 在 中 断 时 需要 做 的 工作 。 遇 到 中 断 时 ， 返 回 地 址 要 么 保存 在 系统 
栈 上 ， 要么 保存 在 特殊 的 寄存 器 中 ， 而 控制 权 则 简单 地 转交 给 操作 系统 设置 好 的 一 个 地 址 ， 
该 地 址 对 应 于 操作 系统 的 通用 第 一 级 中 断 处 理 过 程 。 这 个 处 理 过 程 只 保存 被 中 断 程 序 的 返回 
地 址 ， 并 从 PIC 中 读 出 中 断 设 备 的 身份 然后 跳 转 到 正确 的 处 理 代码 。 通 常 ， 操 作 系 统 的 第 一 
级 处 理 过 程 是 不 可 中 断 的 上 且 运 行 在 一 个 称 为 中 断 模 式 的 特殊 模式 中 ， 因 此 操作 系统 不 需要 担 
EP. CH, EIK (实际 操作 设备 的 软件 ) 在 中 断 处 理 代码 中 做 尽量 少 的 工作 是 
非常 重要 的 。 这 是 为 了 保证 处 理 需 不 会 一 直 被 中 断 处 理 占 用 。 设 备 驱动 中 只 有 时 间 敏 感 的 代 
码 才 会 写 到 中 断 处 理 过 程 中 。 例 如 ，Linux 操作 系统 定义 了 top-half 和 bottom-half 处 理 过 程 。 
根据 定义 ，bottom-half 处 理 过 程 并 没有 top-half 处 理 过 程 那么 紧急 。 设 备 中 非 时 间 敏 感 的 大 量 


工作 会 在 bottom-half 处 理 过 程 中 进行 。 


ww 上 二 


.练习 题 


1. 遇 到 中 断 时 ， 在 将 控制 权 转 交 给 中 断 处 理 过 程 前 ， 需 要 硬件 上 隐 式 地 完成 的 工作 有 哪些 ? 
2. 
2. 


为 什么 不 使 用 JALR 从 中 断 处 理 过 程 中 返回 ? 
将 下 列 步 又 排 成 正确 的 顺序 : 

处 理 过 程 的 实际 工作 

关闭 中 断 

打开 中 断 

从 栈 中 恢复 $k0 

从 中 断 返 回 

将 $k0 保存 到 栈 中 

保存 状态 

处 理 器 如 何 知道 哪个 设备 在 请 求 中 断 ? 


在 下 列 中 断 处理 过 程 代 码 中 ,， 选 出 不 应 位 于 其 中 的 项 。 
_ 关闭 中 断 

保存 PC 

— AF Sko 

_ HFPA 
保存 处 理 器 寄存 器 
执行 设备 代码 
恢复 处 理 器 寄存 器 
RAP 

— WZ $k0 
关闭 中 断 
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. 实现 可 被 中 断 的 中 断 需要 什么 指令 ? 解释 每 一 条 的 功能 和 用 途 ， 并 解释 如 果 没有 这 些 指令 会 怎样 。 
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B 
` 
Rp 


恢复 PC 
— HFPA 
_ 从 中 断 返 回 

7. 在 下 列 INT 宏 状 态 的 操作 中 ， 选 出 不 应 位 于 其 中 的 项 。 
_ 保存 PC 
保存 SP 
$k0—PC 
— FIPA 
_ 保存 处 理 器 寄存 需 
通过 断言 INTA 确认 INT 
在 数据 总 线 上 索引 设备 的 中 断 癌 量 
从 中 断 问 量 表 中 索引 PC 
SMA Tn at eR | SP 
_ KAAP 
PC 从 向 量 表 中 得 到 的 PC 
SP 二 从 向 量 表 中 得 到 的 SP 
OR sr 


参考 文献 注释 和 扩展 阅读 


我 们 只 是 了 解 了 处 理 器 中 断 体系 结构 和 操作 系统 高 效 中 断 处 理 机 制 的 一 些 皮毛 。 对 此 感 兴 趣 的 读者 
可 以 阅读 关于 计算 机 组 成 的 更 高 级 的 教材 (如 [Patterson，2008])， 以 便 了 解 现代 处 理 器 实现 中 断 机 制 的 
有 关 细 节 。 还 有 关于 操作 系统 概念 和 实现 的 书 [Rubini，2001 ; Tanenbaum, 2006; Silberschatz, 2008], 
以 便 获 得 对 中 断 处 理 更 深入 的 知识 。 在 Intel 的 文档 [Intel System Programming Guide 3A, 2008] 上 可 以 
找到 关于 Intel 处 理 器 中 断 体系 结构 很 好 的 讨论 。 
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在 第 3 章 中 ， 我 们 介绍 了 一 种 简单 的 处 理 器 设计 ， 实 现 了 LC-2200 指令 集 。 在 我 们 讨论 
选择 时 钟 周期 的 长 度 ， 以 及 减少 在 实现 每 个 宏 状 态 ( 即 取 址 、 解 码 和 针对 特定 指令 的 执行 状 
A) 时 用 到 的 微 状态 个 数 的 时 候 ， 对 如 何 提高 性 能 有 所 提 及 。 

处 理 带 的 设计 与 实现 需要 进行 量化 的 分 析 。 体 系 结构 的 设计 者 得 不 停 地 评估 加 入 某 个 特 
性 对 性 能 的 影响 有 多 大 。 因 此 ， 我 们 首先 来 讨论 与 处 理 器 设计 相关 的 性 能 指标 。 然 后 再 看 看 
各 种 用 于 改善 处 理 需 性 能 的 方式 。 我 们 首先 在 第 3 章 已 经 讨论 了 的 简单 处 理 器 上 下 功夫 ， 然 
后 由 来 考虑 在 一 个 新 的 称 做 流水 线 的 概念 下 的 改进 方式 。 

首先 ， 让 我 们 引入 一 些 帮 助 我 们 理解 处 理 器 性能 的 指标 。 

5.1 时 间 和 空间 性 能 指标 

如 有 果 说 我 们 在 建造 一 架 飞 机 ， 你 希望 每 趟 飞行 都 装 有 若干 乘客 ， 你 就 得 在 机 舱 内 提供 足 
够 的 空间 ， 足 以 容纳 这 么 多 乘客 、 他 们 的 行李 ， 以 及 路 上 提供 给 他 们 的 食品 。 此 外 ， 你 还 得 
确保 飞机 在 预定 时 间 内 从 A 地 飞 到 B 地 。 飞 机 上 的 乘客 数 也 对 飞行 的 耗 时 有 影响 : 运载 的 乘 
客 越 多 ， 需 要 运载 的 乘客 和 他 们 的 行李 的 重量 就 越 大 ， 对 于 同样 马力 的 引擎 来 说 ， 飞 行 花费 
的 时 间 就 越 多 。 

我 们 来 把 这 个 与 处 理 副 的 性 能 做 个 类 比 。 由 于 和 常见 的 对 处 理 器 的 误解 ， 我 们 在 想到 人 处理 
融 性 能 的 时 候 总 是 想到 Mhz, GHz 和 THz。 这 些 名 词 实际 上 当然 描述 的 是 处 理 器 的 时 钟 频率 。 
我 们 在 第 3 半 知 道 时 钟 周 期 时 间 (即时 钟 频率 的 倒数 ) 是 由 最 坏 情况 下 一 个 时 钟 周期 里 数据 通 
路 的 延 时 来 确定 的 。 

理解 为 什么 处 理 硕 速度 不 只 是 性 能 的 决定 因素 也 很 重要 。 比 方 说 ， 你 写 了 一 个 程序 foo， 
在 某 处 理 硕 上 运行 。 你 感 兴趣 的 性 能 指标 有 两 个 : foo 占用 多 少 内 存 (空间 指标 )，foo 运行 需 
要 多 久 (时 间 指 标 )。 内 存 印迹 是 空间 的 量化 指标 2， 而 执行 时 间 是 时 间 的 量化 指标 。 我 们 把 
前 者 定义 为 给 定 程序 占用 的 空间 ， 把 后 者 定义 为 给 定 程序 运行 的 时 间 。 我 们 来 看 看 这 两 个 指 
标 和 我 们 关于 处 理 需 设计 已 经 提 及 的 部 分 有 什么 关系 。 

一 个 处 理 需 的 指令 集 架构 对 程序 的 内 存 印迹 有 影响 。 首 先 ， 我 们 得 理解 指标 之 间 的 联系 。 
有 人 相信 和 内存 印 迹 越 小 ， 执 行 时 间 就 会 越 短 。 在 20 世纪 70 年 代 普遍 认为 这 个 假定 是 正确 的 ， 
于 是 人 们 便 设 计 出 了 复杂 指令 集 计 算 机 (Complex Instruction Set Computer, CISC) 体系 结构 。 
这 是 由 于 在 20 世纪 70 年 代 ， 编 译 需 技术 还 处 于 起 步 阶 段 ， 高 级 语言 和 指令 集 架 构 之 间 有 着 
广为人知 的 语义 上 的 鸿沟 。 从 事后 来 看 ,我 们 知道 有 效 地 编译 一 个 程序 并 不 需要 异常 复杂 的 
得 邻 ;但 是 在 当时 ， 这 个 事实 并 不 是 那么 显然 。 再 加 上 那个 时 候 内 存 非 党 昂贵 ， 在 内 存 使 用 
方面 尽量 节省 就 成 了 指令 集 设 计 的 目标 。 

CISC 体系 结构 的 评判 标准 是 让 数据 通路 和 控制 单元 为 每 一 条 从 内 存 中 读 取 的 指令 做 更 多 


O 在 第 5 章 和 第 6 章 中 使 用 时 ， 内 存 印 迹 表 示 操 作 系 统 为 一 个 程序 在 载 人 时 分 配 的 静态 空间 。 
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的 操作 。 这 条 准则 导致 指令 集中 不 同 复杂 程度 的 指令 完成 执行 需要 经 过 不 同 数量 的 微 状 态 。 
比如 说 ， 一 个 加 法 指令 需要 较 少 个 微 状 态 以 完成 执行 ， 而 一 个 乘法 指令 就 需要 多 一 些 。 类 似 
地 ， 一 个 使 用 寄存 天 操 作 数 的 加 法 指令 就 需要 比较 少 个 微 状 态 ， 而 使 用 内 存 操作 数 的 加 法 指 
令 就 需要 多 一 些 。 有 了 这 些 更 复杂 的 指令 ， 容 易 想 象 ， 对 于 给 定 的 程序 逻辑 ， 只 需要 更 少 的 
指令 就 能 实现 ， 也 就 有 了 更 小 的 内 存 印 迹 。 
常识 推断 和 计算 机 技术 的 进步 曾 弱 了 这 个 关于 内 存 印 迹 和 程序 性 能 之 间 联 系 的 假设 : 
。 这 是 飞机 类 比 开 始 失效 的 地 方 。 在 之 前 的 类 比 中 ， 乘 客 就 类 似 内 存 中 的 指令 ， 飞 机 中 
的 每 个 乘客 都 需要 被 运 到 目的 地 ， 而 且 每 个 乘客 都 提高 了 飞机 的 总 重量 ， 后 者 又 决定 
了 发 机 的 飞行 时 间 。 但 是 ， 并 不 是 程序 里 的 每 一 条 指令 都 一 定 会 被 执行 到 。 比 如 说 ， 
众所周知 很 多 产品 级 程序 里 一 大 部 分 代码 是 用 来 处 理 程 序 执行 时 可 能 遇 到 的 异常 情况 
的 。 你 根据 你 目 己 的 编程 经 验 就 知道 好 的 软件 工程 实践 是 在 系统 调用 之 后 检查 返回 代 
伺 。 这 部 分 检查 错误 处 理 的 代码 极 少 被 执行 到 。 为 了 把 这 一 点 说 清楚 ， 我 们 来 想象 一 
个 包含 一 百 万 条 指令 的 程序 ， 其 中 有 一 个 紧密 的 循环 ， 只 有 10 条 指令 却 占 用 了 99% 的 
运行 时 间 。 这 种 情况 下 ， 程 序 到 抵 有 多 大 对 执行 时 间 肯 定 片 无 影响 。 
。 第 二 ， 处 理 需 实现 技术 的 进步 〈 主 要 是 用 流水 线 来 执行 指令 的 想法 ， 我 们 会 在 本 章 后 面 
部 分 加 以 讨论 ) 模糊 了 复杂 指令 与 一 串 完 成 同样 工作 的 简单 指令 相 比 所 拥有 的 优势 。 
。 第 三 ， 编 程 方式 由 汇编 逐渐 转 回 高 级 语言 ， 指 令 集 的 有 用 程度 的 衡量 标准 变 成 了 它 对 
编写 编译 融 的 人 来 说 多 么 有 用 。 在 很 多 方面 来 说 ， 编 译 需 技术 的 进步 使 得 我 们 之 前 提 
及 的 语义 鸿沟 变 得 不 那么 可 怕 ， 也 就 使 得 指令 集 的 设计 逐步 远离 CISC。 值 得 一 提 的 
是 ，John Hennessy 和 John Coke， 两 位 精简 指令 集 (随后 会 介绍 ) 章 命 的 先锋 ， 都 既 人 研 
究 体 系 结 构 ， 也 研究 编译 希 。 
。 第 四 点 ， 随 着 半导体 技术 和 超大 规模 集成 电路 的 进步 ， 内 存 价 格 开 始 下 降 ， 也 就 使 得 
程序 大 小 没 原来 那么 值得 关心 。CISC 关于 空间 的 优势 消失 列 尽 。 随 着 这 些 进 步 ， 在 
20 世纪 60 年 代 后 期 引入 的 缓存 机 制 (我 们 将 会 在 第 9 章 中 介绍 ) 也 由 于 半导体 技术 的 
进步 而 变 得 更 加 切实 可 行 。 随 着 缓存 的 到 来 ， 从 主 存 谈 取 数据 到 处 理 需 的 次 数 变 少 了 ， 
也 就 进一步 地 弱化 了 CISC 的 另 一 个 根本 假设 ， 即 读 取 一 条 复杂 指令 消耗 的 时 间 比 读 取 
几 条 简单 指令 要 少 ， 
以 上 几 点 使 得 精简 指令 集 计 算 机 (Reduced Instruction Set Computer, RISC) 在 20 世纪 
70 年 代 末 到 20 世纪 80 年 代 初 兴起 。 尽 管 当 时 有 很 多 关于 CISC 和 RISC 哪个 更 好 的 争论 ， 
现在 它们 已 经 基本 上 不 相干 了 。 实 际 情况 是 两 个 阵营 都 从 对 方 那 里 学 到 了 一 些 好 的 特性 。 我 
们 即将 看 到 ， 在 讨论 流水 线 的 时 候 ， 指 令 集 对 于 保证 处 理 需 每 个 时 钟 周期 执行 一 条 指令 ， 已 
经 不 重要 了 。 比 如 说 ， 现 在 具有 统治 性 地 位 的 指令 集 Intel x86 是 一 个 CISC 体系 结构 的 指令 
集 ， 但 是 实现 却 用 了 RISC 的 哲学 。 从 Pentium Pro/Pentium I 开始 ，CISC 指令 在 Intel x86 处 
理 器 内 部 被 硬件 转换 为 若干 条 RISC 处 理 器 。 另 一 个 具 影 啊 力 的 指令 集 是 ARM (Acron RISC 
Machine， 橡 果 精 简 机 )。 尽 管 ARM 早期 的 时 候 是 一 个 RISC 的 架构 ， 当 今 流行 的 版 本 却 已 经 
包含 了 若干 复杂 指令 。 
我 们 将 在 讨论 多 级 存储 体系 的 第 9 章 对 内 存 印 迹 展 开 更 详细 的 讨论 。 现 在 ， 我 们 只 需要 
注意 程序 的 内 存 印迹 和 它 的 执行 时 间 之 间 并 没有 太 大 的 联系 即 可 。 
那么 ， 是 什么 因素 决定 了 程序 的 执行 时 间 呢 ? 处 理 器 运行 一 个 程序 所 执行 的 指令 个 数 是 
执行 时 间 的 一 个 因素 ， 另 一 个 因素 是 执行 每 条 指令 所 需要 的 微 状 态 个 数 。 由 于 每 个 微 状态 要 
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用 一 个 CPU 时 钟 周期 来 执行 ， 每 个 指令 的 执行 时 间 就 可 以 由 每 条 指令 所 用 到 的 时 钟 周 期 个 数 
(通常 称 作 CPI Clocks Per Instruction， 每 指令 时 钟 周 期 数 ) 来 测算 。 决定 执行 时 间 的 第 三 
个 因 系 则 是 处 理 右 的 时 钟 周 期 时 间 
如 果 n 是 程序 执行 的 总 指令 数 ， 那么 就 有 : 
TAT BT Tel =( > CPI )X 时 钟 周期 时 间 , eB l<j<n ( $-1 } 
有 时 候 考 虑 一 个 程序 所 执行 指令 的 平均 CPI 很 方便 。 那 么 ， 如 果 CPIA,。 是 一 个 程序 所 执 
行 的 指令 集 的 平均 CPI 的 话 ， 我 们 可 以 把 执行 时 间 表 示 成 下 式 : 





执行 时 间 =nXCPIA。Xx 时 钟 周 期 时 间 (5-2 ) 
当然 ， 很 难 定量 地 说 平均 CPI 到 底 是 多 少 ， 因 为 这 个 取决 于 不 同 指令 的 执行 频率 。 我 们 


将 在 下 一 节 里 更 详细 地 讨论 此 问题 。 程序 的 执行 时 间 是 处 理 器 性 能 的 主要 决定 因素 。 也 许 更 
准确 地 说 ， 由 于 时 钟 周 期 时 间 经 第 变化 ， 时 钟 周期 数 ( 即 ,执行 一 个 程序 所 用 的 时 钟 周期 的 
个 数 ) 是 一 个 更 恰当 的 处 理 硕 性 能 的 衡量 标准 。 无 论 如 何 ， 应 当 说 明 处 理 顺 性 能 不 仅仅 是 处 
理 需 速度 。 处 理 融 速度 无 疑 很 重要 ， 但 是 时 钟 周 期 数 ， 即 执行 的 指令 个 数 与 平均 CPI 的 乘积 ， 
也 是 一 个 至 少 同样 重要 的 决定 程序 执行 时 间 的 指标 ， 
一 个 处 理 器 有 三 类 指令 : 
A, B,C:;CPIA = 1; CPlg = 2; CPle = 5. 

Swi, ATHLEAAPERES, 可 能 是 内 存 指令 如 加 载 和 存储 ，C 可 能 是 乘除 法 一 类 的 复 

一 个 编译 器 产生 两 个 不 同 的 指令 序列 以 完成 相同 的 工作 : 

指令 序列 1 执行 A 类 指令 5 条 ，B 类 指令 3 条 ，C 类 指令 1 条 ; 

GA Feo 2 执行 A 类 指令 3 条 ，B 类 指令 2 条 ，C 类 指令 2 条 。 

哪 一 个 指令 序列 运行 起 来 更 快 ? 

答 : 

CO eel 1 需要 执行 9 条 指令 ， 总 共 需 要 16 个 时 钟 周期 。 

指令 序列 2 需要 执行 7 条 指令 ， 但 是 总 共 需 要 17 个 时 钟 周 期 才能 执行 完 。 

因此 ， 指 令 序 列 1 运行 起 来 更 快 - 


5.2 ”指令 频率 


知道 程序 里 某 个 特定 指令 的 执行 频率 是 件 很 有 用 的 事情 。 指 令 频 率 这 个 性 能 指标 表示 的 
就 是 这 个 量 。 静 态 指 令 频 率 是 指 特 定 指令 在 编译 得 到 的 代码 中 出 现 的 次 数 ， 而 动态 指令 频率 
是 指 特 定 的 指令 在 该 程序 实际 运行 的 时 候 被 执行 的 次 数 。 让 我 们 来 理解 一 下 这 两 个 指标 的 重 
要 性 。 静 态 指 邻 频率 影响 内 存 印 迹 ， 因 此 如 果 知 道 了 某 程 序 里 某 特定 指令 的 出 现 次 数 特别 多 ， 
我 们 就 可 以 试图 以 巧妙 的 指令 编码 技术 来 减少 它 所 占用 的 内 存 空间 。 动 态 指 令 频 率 则 影响 程 
序 的 执行 时 间 。 因 此 ， 如 果 知 道 了 某 个 指令 的 动态 频率 特别 高 ， 我 们 就 可 以 尝试 对 数据 通路 
和 控制 部 分 进行 改进 以 确保 该 指令 的 CPI 尽 可 能 小 : 

静态 指令 频率 对 通用 处 理 器 来 说 越 来 越 不 重要 ， 因 为 减少 内 存 印 迹 与 提升 处 理 豆 性 能 相 
比 不 是 那么 重要 了 。 实 际 上 ， 诸 如 特殊 的 指令 编码 这 样 用 来 改善 静态 指令 频率 的 技术 对 性 能 
的 影响 是 负面 的 。 特 殊 的 指令 编码 打破 了 指令 格式 的 统一 ， 而 指令 格式 的 统一 对 于 流水 线 处 
SHAS ( 见 5.10 节 ) 是 至 关 重 要 的 。 但是， 静态 指令 频率 对 于 需要 在 很 受 限 制 的 内 存 空间 里 进 
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FFRAE A SR AD BE AS Oe ATT FEAT SR ES BE 
CE ETENE, HH aST 1000 条 指令 





IT11: ADD 


112: 循环 
1333 
Ija: COND BR Ijo 


Tiooo? 
ADD 指令 在 上 面 的 程序 中 只 出 现 了 一 次 。 指 令 [To 到 ly 构成 了 一 个 循环 800 次 的 循环 体 。 其 他 
所 有 指令 都 恰好 执行 一 次 。 
a. ADD 指令 的 静态 频率 是 多 少 ? 
答 ; 该 程序 的 内 存 印 迹 是 1000 条 指令 。 在 这 1000 条 指令 中 ，ADD 出 现 了 恰好 一 次 。 因 此 ，ADD 
指 今 的 静态 频率 是 1 /1000 X100%=0.1%。9 
b. ADD 指令 的 动态 频率 是 多 少 ? 
答 : 总 共 执 行 的 指令 数 = 在 循环 中 执行 的 指令 数 二 在 循环 外 执行 的 指令 数 
= (800 x 5) + (1000 — 5) X 1 
= 4995 
每 次 循环 会 执行 一 次 ADD 指令 ， 因 此 ADD 指令 执行 次 数 =800. 
ADD 指令 的 动态 频率 
= (ADD 指令 的 执行 次 数 /总 共 执 行 的 指令 数 )X100% 
= (800 / (995 + 4000)) 100% = 16% 


5.3 基准 测试 程序 


我 们 现在 来 讨论 如 何 比较 不 同 机 器 的 性 能 。 经 常 能 看 到 广告 里 大 肆 宣 传 诸如 “X 处理 器 
是 1GHz” 或 者 “YY 处理 带 是 S00MHz” 的 内 容 。 既 然 执 行 时 间 并 不 完全 是 由 处 理 器 速度 来 
决定 的 ， 我 们 如 何 确定 哪 一 个 处 理 器 更 好 呢 ? 基准 测试 程序 是 能 够 代表 处 理 器 负载 的 一 组 程 
序 。 例 如 ， 对 于 在 游戏 机 里 使 用 的 一 个 处 理 器 ， 基 准 测试 程序 也 许 是 个 视频 游戏 。 对 用 于 科 
学 应 用 的 处 理 器 ， 和 矩阵 操作 可 能 是 基准 测试 程序 。 通 常 ， 实 际 程序 的 核心 被 用 做 基准 测试 程 
序 。 比 如 说 ， 和 矩阵 乘法 在 若干 科学 应 用 里 都 会 用 到 ， 并 且 在 这 些 程序 里 往往 是 执行 时 间 的 主 
要 部 分 。 这 时 候 ， 以 和 矩 阵 乘法 例 程 来 对 处 理 器 进行 基准 测试 就 很 意义。 处 理 器 执行 这 样 的 
核心 程序 的 性 能 能 很 好 地 预测 它 执行 整个 应 用 程序 的 期 望 性 能 。 

经 常 是 由 一 组 程序 组 成 一 个 基准 测试 。 有 几 种 不 同 的 方法 来 决定 怎么 使 用 这 些 基 准 测试 
程序 评估 处 理 器 性 能 。 

1) 假设 你 有 一 组 程序 ， 它 们 必须 一 个 接着 一 个 运行 。 这 时 候 ， 一 个 有 用 的 总 体 指标 是 总 
执行 时 间 ， 即 这 些 单个 程序 的 运行 时 间 的 累计 总 和 。 

2) 如 果 你 有 一 组 程序 ， 你 想 在 不 同 的 时 候 运行 它们 ， 而 并 不 是 同时 运行 所 有 的 程序 。 这 


日 ”原文 中 100 之 后 没有 百 分 号 ， 后 面 的 类 似 公 式 里 的 100% 的 情况 也 类 似 。 一 一 译 者 注 
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种 情况 下 ， 和 算术 平 均 数 (AM) 是 个 有 用 的 指标 ， 即 所 有 单个 程序 运行 时 间 的 平均 数 。 值 得 一 
提 的 是 ， 这 个 指标 的 汇总 值 偏 向 于 较为 耗 时 的 基准 测试 程序 (例如 ， 程 序 执行 时 间 : P1=100 
秒 ，P2=1 秒 ; 算术 平均 数 AM 是 55 秒 )。 

3) 情况 类 似 于 上 一 种 ,但 是 你 事先 知道 运行 每 个 程序 的 频率 。 这 种 情况 下 ,一 个 有 用 
的 指标 是 加 权 算 术 平 均 数 ( WAM)， 即 所 有 单个 程序 运行 时 间 的 加 权 平 均 数 。 这 个 指标 考虑 
了 基准 测试 程序 集中 程序 执行 的 相对 频率 (接着 上 面 的 例子 ，P1=100 秒 ，P2=1 PP, f,,=0.1, 
f=0.9， 那 么 加 权 算 术 平 均 数 WAM 是 0.1 x 100+0.9 x 1=10.9 秒 )。 

4) 如 果 你 的 情况 类 似 于 2 ),， 但 是 你 完全 不 知道 程序 之 间 的 相对 执行 频率 。 这 时 候 ， 使 
用 算术 平均 数 可 能 会 叶 致 测量 出 来 的 处 理 带 性 能 有 偏 癌 性 。 这 种 情况 下 ， 男 一 个 汇总 指标 是 
几何 平均 数 ( GM)， 即 p 个 数 乘积 的 p 次 方 根 (接着 上 面 的 例子 ，P1=100 秒 ，P2=1 秒 ， 几 何 
平均 数 GM=sqrt(100 x 1)=10 秒 )。 这 个 指标 去 除了 算术 平均 数 中 存在 的 偏向 于 大 数值 的 问题 。 

5 ) 调和 平均 数 ( HM) 也 是 一 个 有 用 的 综合 指标 。 从 数学 上 说 ， 它 的 计算 方法 是 把 数值 
的 倒数 的 平均 数 算出 来 再 取 倒 数 。 这 也 有 助 于 矫正 算术 平均 数 中 存在 的 偏 问 大 数值 的 问题 。 
我 们 一 直 在 考虑 的 那个 例子 (程序 的 执行 时 间 是 P1=100 秒 ，P2=1 秒 ) 的 调和 平均 数 HM 是 


调和 平均 数 =1/( 倒 数 的 算术 平均 数 ) 
= 1 / (((1/100) + (1/1))/2) = 1.9801 


在 数据 由 比例 构成 时 ， 调 和 和 平均 数 被 认为 特别 有 用 。 

如 果 所 有 的 数值 都 一 样 ， 那 么 以 上 三 个 复合 指标 (算术 平均 数 ， 几 何平 均 数 和 调和 平均 
数 ) 得 到 的 结果 是 相同 的 。 一 般 来 说 ,算术 平均 数 趋 铝 于 偏 癌 数据 中 的 较 大 者 ， 调 和 平均 数 
趋向 于 偏向 数据 中 的 较 小 者 ， 而 几何 平均 数 趋同 于 处 在 两 者 之 间 。 一 个 有 用 的 经 验 法 则 是 在 
数值 的 绝对 值 很 大 的 时 候 使 用 调和 平均 数 ， 在 绝对 值 很 小 的 时 候 使 用 算术 平均 数 。 这 里 给 我 
们 的 启示 是 ， 在 使 用 单个 综合 指标 来 评价 一 个 体系 结构 的 时 候 ， 必 须 非常 小 心 谨慎 。 

多 年 来 ， 人 们 创建 了 若干 个 基准 测试 程序 ， 用 以 评价 体系 结构 。 在 工程 /科学 工作 站 
最 广 为 接受 的 是 SPEC 基准 测试 ， 由 独立 非 营 利 机 构 标 准 性 能 评估 公司 (SPEC, Standard 
Performance Evaluation Corporation) 开发 。 它 的 目标 是 “建立 、 维 护 和 支持 一 组 标准 化 的 相 
关 的 基准 测试 程序 ， 用 于 最 新 一 代 的 高 性 能 计算 机 。”9 SPEC 基准 测试 由 一 组 泛 用 的 应 用 程 
序 组 成 ,包括 了 科学 应 用 、 事 务 处 理 、Web 服务 器 等 ， 代 表 了 通用 处 理 器 的 常见 负载 。 有 

处 理 器 性 能 不 只 是 由 处 理 器 时 钟 频率 决定 这 一 事实 ， 使 得 进行 基准 测试 很 困难 。 比 如 说 ， 
除了 时 钟 频率 以 外 ， 内 存 系统 的 组 织 和 处 理 器 - 内 存 总 线 带宽 也 都 是 关键 性 的 决定 因素 。 而 
H, 不 同 的 基准 测试 程序 的 行为 对 整体 系统 有 着 不 同 的 需求 。 因 此 ， 当 对 比 两 个 时 钟 频率 相 
似 甚至 相同 的 处 理 器 时 ， 我们 也 许 会 发 现 其 中 一 个 在 某 些 基 准 测试 程序 上 表现 较 好 ， 而 为 一 
个 在 男 一 些 测试 中 表现 较 好 。 这 就 是 为 什么 在 不 知道 要 运行 什么 样 的 负载 的 时 候 ， 综 合 指 标 
很 有 有用。 但是， 我 们 也 必须 谨慎 地 避免 过 度 使 用 统计 指标 ， 正 如 名 言 所 说 ,“ 谎 言 ， 该 死 的 话 
言 ， 以 及 统计 数字 ”。® 


来 源 www.spec.org/。 

参见 www.spec.org/cpu2006/publications/CPU2006benchmarks.pdf， 里 面包 含 了 对 SPEC2006 基准 测试 程序 
测量 整数 和 浮 点 性 能 的 介绍 。 

© Æ www.york.ac.uk/depts/maths/histstat/lies.htm: 
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SPECint2006 整数 基准 测试 程序 集 由 12 个 程序 组 成 ， 用 以 定量 测量 处 理 器 执行 整数 计算 程序 (与 


浮 点 运算 相对 ) HEHE. FORA T Intel Core 2 Duo E6850 (3 GHz) 处 理 器 运行 SPECint2006 的 性 能 : 





程序 名 运行 时 间 ( 秒 ) 
400.perlbench Perl 语言 的 应 用 程序 510 
403.gcc C 语言 编译 器 382 
462.libquantam 422 
464.h264ref Rit A Si 708 
471.omnetpp 离散 事件 模拟 362 


473.astar 寻 路 算法 465 
483.xalancbmk XML 处 理 302 


a. 计算 算术 平均 数 和 几何 平均 数 。 
答 : 
算术 平均 数 =(510 + 602 + … + 302/12 = 491.8 秒 。 
几何 平均 数 =(510 X 602 X --- X 302)1/12 = 474.2 $. 
注意 ， 算 术 平 均 数 的 结果 偏向 于 这 组 数据 中 的 较 大 值 。 
b. 某 系统 用 来 以 如 下 频率 运行 这 12 个 程序 : 
© 10% 视频 压缩 
。10% XML 处 理 
。30% 寻 路 算法 
© 50% 所 有 剩 下 的 程序 
计算 此 工作 负载 下 的 加 权 算 术 平均 。 
EE 


mi: 
此 工作 负载 的 50% 时 间 被 均匀 分 给 9 个 程序 ， 它 们 的 平均 执行 时 间 
= (510 + 602 + 382 + 328 + 548 + 593 + 679 + 422 + 362)/9 
= 491.8 秒 。 
tn A RFH = (0.1 X 708 + 0.1 X 302 + 0.3 X 466 + 0.5 X 491.8) 
= 486.7 秒 。 


这 些 指标 有 用 的 原因 之 一 是 它们 为 对 比 不 同体 系 结构 、 不 同 实现 和 不 同人 硬件 规格 的 机 
器 提供 了 一 个 基准 。 但 是 ， 正 如 例 5-3 所 示 ， 单 纯 的 数字 难以 用 来 对 比 不 同 的 机 答 。 因 此 ， 
SPEC 基准 测试 的 结果 是 以 与 某 参 考 机 器 的 比值 的 形式 公布 的 。 例 如 ， 如 果 一 个 基准 测试 程序 
在 目标 机 器 上 运行 需要 x 秒 ， 而 同一 个 程序 在 参考 机 器 上 运行 需要 y 秒 ， 那 么 这 个 基准 测试 
程序 在 目标 机 器 上 的 SPECratio (SPEC 比值 ) 就 被 定义 为 
SPECratio = 参考 机 器 上 的 执行 时 间 / 目标 机 器 上 的 执行 时 间 = y/x 


SPEC 组 织 选择 Sun 微 系 统 公 司 的 Ultras 10 工作 站 作为 SPEC CPU 2000 测试 的 参考 机 


© Xi: www.spec.org/cpu2006/results/res2007q4/cpu2006-20071112-02562.pdf. 
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ar, EIEH S— fil 300MHz 的 SPARC 处 理 器 ， 有 256MB 的 内 存 。 这 种 机 器 也 是 SPEC CPU 
2006 WE BLA. 

不 同 基 准 程序 的 SPECratio 可 以 用 几 种 统计 学 手段 (算术 、 加 权 算 术 、 几 何 、 调 和 ) 中 的 
一 种 来 合并 成 单一 的 结果 。 因 为 我 们 在 使 用 SPEC 基准 测试 作为 标准 的 性 能 报告 手段 时 面 对 
的 数字 是 比例 值 ， 习 惯 上 使 用 调和 平均 数 。 

SPECratio 的 好 处 是 它 是 比较 机 需 的 基准 。 比 如 说 ， 如 果 机 器 A 和 了 B 的 平均 SPECratio 分 
别 是 Ra 和 Ra， 我 们 就 可 以 立刻 得 出 这 两 台 机 器 的 性 能 的 对 比 结论 。 


5.4 ”提升 处 理 器 的 性 能 


为 了 探索 提升 处 理 胡 性 能 的 几 条 道路 ， 一 个 好 的 出 发 点 是 那个 关于 执行 时 间 的 方程 。 让 
我 们 来 独立 地 看 它 的 每 一 项 ， 理 解 它 们 分 别提 供 了 怎样 的 优化 机 会 。 
。 减少 时 钟 周期 时 间 时钟 周期 是 由 最 坏 情 况 的 数据 通路 延 时 决定 的 。 降 低 时 钟 周期 时 
间 也 就 是 提升 时 钟 频率 。 我 们 可 以 重新 安排 数据 通路 的 元 素 以 降低 最 坏 情 况 的 延 时 (EE 
如 说 ， 在 数据 通路 的 布局 上 把 它们 摆 放 得 更 靠近 一 些 )。 我 们 还 可 以 减少 单个 时 钟 周 期 
里 数据 通路 动作 的 个 数 。 但是， 这 种 对 减少 时 钟 周 期 的 答 试 对 执行 不 同 指令 所 需要 的 
CPI 个 数 是 有 影响 的 。 如 有 果 还 想 要 再 减少 时 钟 周 期 时 间 ， 就 得 设法 减 小 单个 数据 通路 元 
RASTER. Brak RTC Ee PS, it BEBE h Br AY A ile T. A 
置 拷 术 ， 来 减 小 特征 玉 寸 。 
e 改进 数据 通路 组 织 以 减 小 CPI 在 第 3 革 中 ,实现 使 用 了 单一 的 总 线 。 这 样 的 组 织 尖 
小 了 硬件 中 数据 通路 的 元 素 的 并 发 程度 。 我 们 暗示 过 ， 可 以 通过 使 用 多 条 总 线 来 提升 
硬件 的 并 发 性 。 再 说 一 次 ， 任 何 这 类 答 试 都 可 能 对 时 钟 周 期 时 间 有 者 负面 影响 ， 因 此 
需要 仔细 分 析 。 设 计 处 理 器 的 微 体系 结构 并 优化 实现 来 获得 最 高 的 性 能 ， 无 论 在 学 术 
界 还 是 工业 界 都 是 一 个 多 产 的 研究 领域 。 
以 上 两 点 都 集中 在 降低 单条 指令 的 延迟 ， 以 使 得 总 的 执行 时 间 辊 积 起 来 得 以 减少 。 夯 一 
个 减少 执行 时 间 的 机 会 是 减少 指令 条 数 。 
。 减 少 执行 的 指令 条 数 ”一 种 减少 程序 里 执行 的 指令 条 数 的 可 能 是 ， 把 侧 单 指令 换 为 更 
加 复杂 的 指令 。 这 应 当 能 减少 程序 执行 的 总 指令 条 数 。 我 们 也 已 经 看 到 过 这 个 思路 的 
反例 。 再 重复 说 一 遍 ， 在 试图 引入 新 的 复杂 指令 的 时 候 ， 必 须 仔 细 权 衡 CRI、 时 钟 周 期 
时 间 和 动态 指令 频率 。 编 译 器 优化 是 另 一 个 减少 执行 指令 条 数 的 优化 方式 ， 在 现代 计 
算 机 系统 里 ， 这 对 于 决定 长 时 间 运 行 的 程序 的 执行 时 间 至 关 重 要 。 
从 前 面 的 讨论 中 也 应 当 看 出 ， 执 行 时 间 的 三 个 组 成 部 分 是 紧密 相关 的 ， 必 须 一 起 进行 优 
化 ， 不 能 隅 离 起 来 考虑 。 


某 体 系 结构 有 三 种 指令 ，CPI 如 下 : 


类 型 CPI 
A 2 
B 5 
k I 


基体 系 结 构 设计 者 计算 出 可 以 在 不 影响 另外 两 种 指令 类 型 的 CPI 的 情况 下 把 B 指令 的 CPI 降低 
到 3， 但 是 同时 也 会 增加 该 CPU 的 时 钟 周期 时 间 。 问 、 时 钟 周期 时 间 增 长 多 少 比例 以 内 ， 这 个 体系 
结构 的 修改 有 意义 ? 假设 该 处 理 器 上 执行 的 所 有 的 工作 负载 里 A 指令 占 30%，B 指令 占 10%, C 指 
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令 占 60%. 
答 : 
令 Co 和 Cn 分 别 为 卓 机 器 和 新 机 器 的 时 钟 周 期 时 间 。 令 N 为 程序 里 执行 的 指令 总 数 。 
旧 机 器 的 执行 时 间 是 
ET gua = N X(F, X CPI,, + Fp X CPI, t FeeX CPle) X Co 
其 中 FA、CPIA。、Fe、CPIs。、Fc、CPIc。 分 别 是 每 种 指令 的 动态 频率 和 CPI. 
旧 机 器 的 执行 时 间 是 : 
ET uag = NX(0.3xX2+0.1X5+0.6X1)xCo 
=NX1.7Co 
新 机 器 的 执行 时 间 是 
ET ag =NX(0.3X2+0.1%3+0.6X1)XCn 
=NX1.5Cn 
为 了 使 新 设计 有 意义 ， 就 必须 有 
ET 新 机 器 < ET 日 机 器 
Nx 1.5 Cn <N X 1.7 Co 
Cas L715 Co 
Cn < 1.13 Co 
因此 时 钟 周 期 最 多 允许 上 升 13%。 


5.5 加速 比 


比较 处 理 器 执行 同一 个 程序 或 者 基准 测试 程序 集 的 执行 时 间 ， 是 理解 一 个 处 理 胡 与 为 一 
个 处 理 絮 相对 性 能 的 最 显然 的 方法 。 类 似 地 ,我们 可 以 比较 进行 某 种 被 提议 的 改动 前 后 的 执 
行 时间 的 改进 程度 ， 以 量化 这 个 修改 所 市 来 的 性 能 提升 。 


定义 
EeP Ab 38 B 上 的 执行 时 间 aa) 
ae at oe an 5-3 
“Aga 处 理 器 A 上 的 执行 时 间 
处 理 器 A 与 处 理 器 B 的 加 速 比 是 处 理 器 B 上 的 执行 时 间 与 处 理 器 A 上 的 执行 时 间 的 比值 。 
类 似 地 ， 
改进 前 的 执行 时 间 
167 改进 后 的 执行 时 间 


改进 带 来 的 加 速 比 是 改进 前 的 执行 时 间 与 改进 后 的 执行 时 间 的 比值 。 
以 下 是 某 体系 结构 的 指令 的 CPI: 


指令 CPI 
ADD 2 
SHIFT 3 


其 他 2( 所 有 指令 的 平均 ， 包 括 ADD 和 SHIFT) 

通过 对 程序 的 性 能 进行 分 析 ， 一 个 体系 结构 设计 者 发 现 ADD 指令 后 面 紧 跟着 SHIFT 指令 的 组 
合 在 整个 程序 中 占用 了 20% 的 动态 频率 。 他 设计 了 一 条 新 指令 ， 一 个 ADD/SHIFT HAZ, CPI 为 4。 

如 果 把 程序 里 的 所 有 {ADD, SHIFT} 都 换 成 这 条 新 指令 ， 程 序 性 能 能 提升 多 少 ? 
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答 : 
令 原 程序 中 执行 的 指令 条 数 为 N， 那 么 原 程序 的 执行 时 间 
=NXADD/SHIFT 的 频率 X(2+3)/24+NX 其 他 指令 的 频率 x2 
=Nx0.2x2.5+NX0.8x1.875=2.0N 
在 把 {ADD, SHIFT} 换 成 新 指令 以 后 ， 新 程序 的 总 指令 数 降低 到 了 0.9N。 在 这 个 新 程序 中 ， 组 
合 指令 出 现 的 频率 是 1/19， 其 他 指令 出 现 的 频率 是 8/9。 
新 程序 的 执行 时 间 
=(0.9N)X 组 合 指令 的 频率 K4+(0.9N)X 其 他 指令 的 频率 x2 
= (0.9 N) X (1/9) x 4 + (0.9 N) X (8/9) X 1.875 
=1.9N 
程序 的 加 速 比 = 旧 执 行 时 间 /新 执行 时 间 
= (2.0N) / (1.9N) 
= 1.05 © 
为 一 个 有 用 的 指标 是 改进 种 来 的 性 能 提升 比例 
执行 时 间 的 提升 比例 LB ee (5-5 ) 
原 执行 时 间 
time 一 个 程序 要 执行 1000 条 指令 ,平均 CPI 为 3， 时 钟 周期 时 间 为 2ns。 一 个 体系 结构 设计 者 提出 
了 两 个 可 能 的 方案 :( 1 ) 可 以 将 指令 的 平均 CPI 减 少 25%， 同时 时 钟 周 期 时 间 延 长 10%; (2) 可 以 将 时 
钟 周期 时 间 减 少 20%， 但 是 同时 CPI 会 增加 15%, 
a 你 是 负责 决定 选择 哪个 选项 的 经 理 。 给 出 你 的 决策 背后 的 理由 。 
答 : 
令 EO, El, E2 分 别 表示 原始 机 器 、 第 一 个 选项 和 第 二 个 选项 下 的 执行 时 间 。 
E0 = 1000 X 3 X2 ns 
El = 1000 X (3 X 0.75) X 2 (1.1) ns = 0.825 E0 
E2 = 1000 X (3 X 1.15) x 2 (0.8) ns = 0.920 EO 
选项 El 更 好 ， 因 为 它 的 执行 时 间 比 E2 短 。 
b. 你 选择 的 选项 的 执行 时 间 与 原 设计 相 比 ， 有 多 大 的 改进 ? 
Z: 选项 1 相对 原 设计 的 改进 =(E0-E1)/E0 
= (E0-0.825 E0) / E0 
=i), 175 
因此 改进 比例 为 17.5%. 


另 一 种 理解 改进 的 效果 的 方式 是 ， 考 虑 它 带 来 的 改变 影响 执行 时 间 的 程度 。 例 如 ， 这 个 
改动 可 能 只 影响 到 执行 时 间 的 一 部 分 。 一 个 以 并 行 计 算 先 驱 吉 恩 ` 阿 姆 达 尔 ( Gene Amdahl) 
命名 的 定律 可 以 用 来 说 明 这 个 想法 : 

阿 姆 达 尔 定律 

Time 改动 后 二 Time 不 受 影响 的 部 分 十 Time 受 影 响 的 部 分 /XX ( 5-6 ) 

EEP, Time yap oa SAT TA), EASE Me oP UT AT Ta] (Time 
不 受 影响 的 部 分 】 加 上 受 影响 的 部 分 的 执行 时 间 (Time zme) 除 以 这 个 改进 对 受 影响 部 分 的 加 速 

日” 原 书 中 的 计算 有 误 ， 已 更 正 。 一 一 译 者 注 
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比 (以 x 表 示 )。 简 ae ee 尔 定律 意味 着 提升 处 理 器 性 能 应 当 把 资源 花 在 对 执行 
时 间 影 响 最 大 的 关键 指令 
# 5-1 总 cron ge SN 


表 5-1 性 能 指标 小 结 


7 E 
ive a_i re a 
执行 时 间 (> CPIHj) x 时 钟 周 期 频率 , | Bb 执行 恰好 有 n 个 指令 的 程序 的 运行 时 间 





Wl<j<na 
算术 平均 数 ph 个 基准 测试 程序 执行 时 间 的 平均 值 
FF 


加 权 算术 平均 数 个 基准 测试 程序 执行 时 间 的 加 权 平 均值 
fp x Ep) 

几何 平均 数 ie x E2 x ... x Ep) ÉJ p|# 个 基准 测试 程序 执行 时 间 的 乘积 的 p 次 方 根 
和 sa 下 

调和 平均 数 Il/(((UVE1) + (1/E2) +... + (1/ | Zb 个 基准 测试 程序 执行 时 间 的 倒数 的 算术 平均 数 的 
Ep))/p) aig 


静态 指令 频率 一 一 一 一 此 一 指令 i 在 编译 出 的 代码 中 出 现 的 次 数 


动态 指令 频率 ”|% | 指令 i 在 执行 的 代码 中 出 现 的 次 数 
加 速 比 (M, 比 Ms 的 ) FRAM 机 器 A 与 机 器 B 相 比 的 加 速 比 
加 速 比 (改进 措施 的 ) 改进 带 来 的 加 速 比 
执行 时 间 的 改进 比例 新 与 日 相 比 的 改进 比例 
阿 姆 达尔 定律 Time aay = Time xawmaisy | 各 是 改进 的 加 速 比 

+ Time 受 影响 的 部 分 /XX oan 





Ea 某 处 理 器 把 20% 的 时 间 花 在 ADD 指令 上 。 一 个 工程 师 提议 将 ADD 指令 的 性 能 优化 到 原来 的 
四 倍 ， 这 个 改动 对 性 能 能 提升 多 少 ? 
答 : 
文 个 改进 只 对 ADD 指令 有 效 ， 所 以 有 80% 的 执行 时 间 不 受 影响 。 
原来 的 标准 化 的 执行 时 间 = 1 
新 的 执行 时 间 = (E ADD 指令 上 的 时 间 /4)+ 剩 下 部 分 的 执行 时 间 





=0.2/4+0.8 
= 0.85 
加 速 比 = 改进 前 的 执行 时 间 / 改进 后 的 执行 时 间 


= 1/085 
= 1.18 


5.6 提升 处 理 器 的 吞吐 量 


到 现在 为 止 ， 我 们 主要 关注 的 是 通过 减少 单条 指令 的 延迟 来 提升 处 理 需 性 能 的 技术 。 另 
一 种 提升 处 理 需 性 能 的 思路 则 截然 不 同 不 关注 单条 指令 的 延迟 (BN CPI 指标 )， 而 关注 吞 
吐 量 ， 即 每 单位 时 间 处 理 器 所 执行 的 指令 数 。 延 迟 回答 的 问题 是 处 理 器 执行 单条 指令 所 花费 
的 时 间 (BY CPI)， 而 相反 ， 吞吐 量 回答 的 问题 则 是 处 理 需 每 个 时 钟 周 期 执行 多 少 条 指令 〈 可 





日 ” 阿 姆 达尔 定律 对 并 行 机 器 上 的 程序 的 性 能 改进 有 严重 影响 。 参 见 第 12 章 的 练习 题 16， 其 中 会 涉及 并 行 系统 。 


© 原文 漏 了 最 后 “的 倒数 ” 几 个 字 。 一 一 译 者 注 
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PRYE IPC, Instruction Per Clock cycle， 每 时 钟 周期 的 指令 数 )。 这 个 概念 就 叫做 流水 线 ， 它 是 
本 章 剩 余部 分 的 焦点 。 


5.7 流水线 简介 


欢迎 来 到 比尔 的 三 明治 店 ! 比尔 的 商店 里 有 各 式 各 样 的 面包 、 调 味 品 、 奶 酷 、 肉 和 蔬菜 
可 供用 户 选 购 ， 这 些 货品 分 门 别 类 地 放 在 各 个 柜台 里 。 在 比尔 创业 早期 ， 他 的 整个 团队 就 是 
他 目 己 一 个 人 。 他 接 到 订单 ， 按 顺序 经 过 一 个 接 一 个 的 柜台 ， 同 时 根据 订单 要 求 做 出 相应 的 
三 明治 。 现 在 他 的 生意 已 经 扩大 了 ， 他 有 五 个 雇员 ， 每 个 站 在 一 个 柜台 前 ， 组 成 一 个 三 明治 
流水 线 : 接 订 单 、 选 择 面 包 和 调味 料 、 选 择 奶 酷 、 选 择 肉 类 ， 最 后 选择 蔬菜 。 下 表 就 展示 了 
三 明治 流水 线 流程 。 













柜台 1 ( 按 订 单 ) 
最 新 订单 (第 5 个 ) 






柜台 2 (选择 面包 ) | 柜台 3 (选择 奶酪) iR 4 (选择 肉 类 ) 


每 个 柜台 的 雇员 都 在 处 理 一 个 不 同 的 订单 ， 最 后 一 个 柜台 (柜台 5) 在 处 理 第 一 个 订单 的 
时 候 ， 第 一 个 柜台 已 经 在 处 理 一 个 新 的 三 明治 的 订单 了 。 每 个 柜台 在 做 了 自己 的 事情 以 后 都 
把 三 明治 半成品 以 及 订单 传递 给 下 一 个 柜台 。 比 尔 是 个 聪明 的 管理 者 ， 他 并 没有 让 一 个 雇员 
去 处 理 整 个 订单 ， 因 为 这 样 的 话 他 的 柜台 上 就 得 堆 满 做 三 明治 的 所 有 材料 ， 也 就 毫 无 必要 地 
增加 了 堆放 的 原材料 的 量 ， 因 为 每 个 顾客 可 能 只 用 到 原材料 的 一 部 分 。 相 反 ， 比 尔 精 心地 把 
工作 分 配 成 大 致 相等 的 五 份 ， 因 此 不 会 有 哪个 雇员 闲 着 没事 做 。 当 然 了 ， 如 果 某 个 特定 的 三 
明治 订单 不 需要 某 类 材料 ， 那 么 对 应 的 雇员 只 需要 传递 一 下 半成品 就 行 了 。 不 过 ， 大 部 分 时 
间 〈 尤 其 是 高 峰 时 间 ) 里 ， 比 尔 的 雇员 都 忙碌 地 快速 制作 着 三 明治 。 

比尔 将 他 供应 三 明治 给 消费 者 的 速度 提升 到 了 原来 的 五 倍 。 


5.8 指令 处 理 流水 线 


你 能 猜 得 出 来 ,我 们 拿 比 尔 的 三 明治 店 要 类 比 什 么 。 在 LC-2200 的 简单 实现 里 ， 有 限 上 自 
动机 每 次 执行 一 条 指令 ， 从 取 指 令 、 解 码 ， 最 后 到 执行 ， 一 路 做 下 去 ， 然 后 再 进行 下 一 条 指 
令 。 这 个 方法 的 问题 是 数据 通路 没有 得 到 良好 的 利用 。 这 是 因为 ， 对 于 每 个 宏 状 态 来 说 ， 并 
不 是 所 有 的 资源 都 用 上 了 。 我 们 不 必 回 想 在 第 3 章 中 实现 LC-2200 指令 集 的 时 候 所 使 用 的 特 
定 的 数据 通路 。 因 为 ,不管 数据 通路 的 细节 如 何 ， 我 们 知道 任何 一 种 LC-2200 指令 集 的 实现 
都 需要 以 下 的 数据 通路 资源 : FE. PC. ALU, aff ate. IR 和 符号 扩展 器 。 图 $-1 展示 了 
我 们 在 若干 个 指令 的 每 个 宏 状态 里 使 用 到 的 硬件 的 数据 通路 资源 。 


柜台 5 (选择 蔬菜 ) 
第 1 个 订单 





用 到 的 数据 通路 资源 
ALU PC 内 存 


执行 (ADD) ALU ”寄存 器 堆 
执行 (LW) ALU AY FFA HE Wife FF Sa eat 





图 5-1 不 同 的 宏 状态 使 用 到 的 数据 通路 资源 


我 们 可 以 立刻 得 出 以 下 两 点 观察 结 采 : 
1 ) IR 在 每 个 安 状 态 里 都 被 用 到 了 。 这 毫 不 奇怪 ， 因 为 IR 包含 了 指令 ， 然 后 执行 中 的 每 
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一 步 都 会 用 到 IR 的 一 部 分 。IR 就 等 价 于 三 明治 流水 线 里 的 “订单 ”， 需 要 传递 过 每 个 柜台 。 
2) 在 宏观 的 层面 上 来 说 ,我 们 能 看 出 这 三 个 宏 状 态 中 需要 做 的 工作 量 不 同 。 有 限 自动 机 
里 的 每 个 状态 就 等 价 于 三 明治 流水 线 里 的 一 个 柜台 。 
我 们 想 尽 可 能 地 一 直 利用 数据 通路 的 所 有 硬件 资源 。 在 三 明治 流水 线 里 ,我 们 通过 同时 
制作 多 个 三 明治 让 所 有 的 柜台 都 一 直 忙 碌 。 我 们 因而 尝试 把 三 明治 流水 线 的 想法 实施 到 处 理 
佑 的 指令 执行 上 面 去 。 一 个 程序 就 是 一 个 指令 序列 ， 如 图 5-2 所 示 。 


LW Rl, MEM [1000]; R1 < 内 存 地 址 1000 处 的 数据 
LW R2, MEM [2000]; R2 二 内 存 地 址 2000 处 的 数据 


ADD R3, R5, R4; R3 + R4 + R5 


NAND R6, R7, R8; R6 < R7 NAND R8 


SW R9, MEM [3000]; R9 > 内 存 地 址 3000 处 的 数据 





图 5-2 一 个 程序 就 是 一 个 指令 序列 


在 使 用 有 限 状态 机 的 简单 实现 里 ， 处 理 器 执行 指令 的 时 间 轴 看 起 来 就 像 是 图 5-3a 的 样 
子 。 前 一 条 指令 执行 完了 ， 新 一 条 指令 才 会 执行 。 采 用 三 明治 流水 线 的 想法 ， 我 们 能 看 出 ， 
为 了 最 大 化 数据 通路 资源 的 利用 率 ， 我 们 应 该 在 指令 流水 线 里 同时 执行 多 条 指令 ， 如 图 5-3b 
所 示 。 问 题 就 来 了 : 这 可 能 吗 ? 如 果 你 是 三 明治 流水 线 中 的 雇员 之 一 ， 制 作 你 的 三 明治 完全 
不 取决 于 流水 线 里 的 前 一 个 或 者 后 一 个 顾客 想 要 什么 样 的 三 明治 。 程 序 里 的 相 邻 指令 是 不 是 
也 是 类 似 地 互相 不 依赖 呢 ? 你 会 立刻 觉得 答案 是 不 ， 因 为 程序 是 顺序 执行 的 。 然 而 ， 看 看 图 
5-2 里 的 指令 序列 ， 尽 管 程序 是 顺序 执行 的 ， 但 是 可 以 看 出 指令 I, 到 这 五 条 指令 都 碰巧 互 
相 不 依赖 。 也 就 是 说 ， 一 条 指令 的 执行 不 依赖 于 它 之 前 的 指令 的 结果 。 我 们 很 快 会 指出 ， 这 
种 令 人 开心 的 情况 并 不 总 是 常态 ， 我 们 会 在 5.13 节 中 处 理 处 理 器 流水 线 的 这 种 依赖 关系 。 但 
是 ， 现 在 为 了 方便 考虑 ， 我 们 不 妨 认 为 指令 互相 不 依赖 ， 以 说 明 将 三 明治 流水 线 的 想法 应 用 
于 处 理 絮 流水 线 设计 上 的 可 能 性 。 

注意 ， 在 图 5-3b 中 的 流水 线 执行 的 时 间 轴 里 ， 每 当前 一 条 指令 进入 下 一 个 状态 就 开始 
处 理 一 条 新 的 指令 。 如 果 这 是 可 行 的 ,那么 就 能 把 指令 的 吞吐 量 提高 到 三 倍 。 主 要 观察 数 
据 通路 资源 类 似 于 三 明治 流水 线 中 的 各 种 食材 ， 宏 状态 类 似 于 三 明治 流水 线 中 的 各 个 柜台 
的 雇员 。 
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时 间 








时 间 


和 


图 $-3 ”执行 的 时 间 轴 。a 中 处 理 器 一 次 处 理 一 个 指令 ，L 依次 执行 完 E、D、E 宏 状态 之 
后 ,L 才 执 行 ， 以 此 类 推 。b 中 ， 同 时 会 有 多 条 指令 处 在 不 同 的 执行 阶段 ， 比 如 说 ， 
在 时 刻 3, EERS, L FED RA, 1, HE FRA 


5.9 简单 指令 流水 线 的 问题 


以 下 是 简单 地 把 三 明治 流水 线 应 用 到 指令 流水 线 上 产生 的 问题 。 

1 ) 不 同 的 执行 阶段 经 常会 用 到 同一 个 数据 通路 的 资源 (如 ALU M IR). 

2) 不 同 阶段 的 工作 量 不 相同 。 例 如 ， 对 比 一 下 图 5-1 中 解码 和 执行 (LW) 状态 的 工作 量 。 
前 者 是 简单 的 组 合 函 数 ， 用 以 确定 指令 类 型 和 所 需 资源 ; 而 后 者 却 涉及 计算 地 址 、 内 存 访问 和 
把 数据 写 入 寄存 器 堆 。 一 般 来 说 ， 执 行 阶段 所 做 的 工作 远 远 超过 了 其 他 阶段 所 做 的 工作 。 

让 我 们 来 理解 一 下 第 一 个 问题 ， 即 不 同 执行 阶段 之 间 存 在 对 资源 的 争夺 意味 者 什么 。 这 
常常 被 称 做 结构 性 冒险 ， 它 是 由 数据 通路 的 局 限 性 ， 如 单一 了 豚 、 单 一 ALU 以 及 单一 连接 数 
据 通路 的 各 元 素 的 总 线 导 致 的 。 在 三 明治 生产 线 中 ， 一 个 订单 (等 价 于 IR) 就 是 一 张 纸 ， 在 
柜台 之 间 传 来 传 去 ， 而 三 明治 半成品 (等 价 于 执行 了 一 部 分 的 指令 ) 也 在 柜台 之 间 直 接 传递 
(也 就 是 说 ， 并 没有 用 到 我 们 的 数据 通路 例子 里 用 到 的 集中 “总 线 ”)。 我 们 可 以 通过 使 用 类 
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似 的 想法 来 修正 我 们 的 指令 流水 线 的 问题 。 比 如 说 ， 如 果 我 们 给 取 指 令 阶 段 增 加 一 个 额外 的 
ALU、 一 个 额外 的 IR 以 及 一 个 额外 的 访 存 器 ， 这 个 阶段 与 其 他 阶段 之 间 就 没有 资源 争夺 了 。 
容易 理解 为 什么 需要 一 个 额外 的 ALU， 因 为 取 指令 和 执行 两 个 阶段 都 需要 用 到 ALU。 但 是 我 
们 需要 理解 拥有 一 个 额外 的 指令 寄存 器 意味 着 什么 。 好比 三 明治 生产 线 里 面 订 单 从 一 个 柜台 
传递 到 另 一 个 柜台 ， 我 们 把 IR 里 的 内 容 从 取 指 令 阶 段 传递 到 解码 阶段 ， 依 次 类 推 ， 以 确保 各 
个 阶段 互相 独立 。 

太一 种 更 严重 的 结构 性 冒险 ， 由 流水 线 的 取 指 令 和 执行 阶段 引起 。 取 指令 阶段 需要 在 每 
个 时 钟 周 期 访问 内 存 以 取得 指令 。 此 外 如 果 执 行 阶 段 有 加 载 或 存储 指令 ， 那 么 它 也 需要 访问 
内 存 。 我 们 怎样 才能 解决 这 个 问题 呢 ? 一 个 简单 的 解决 方案 是 规定 取 指 令 和 执行 阶段 要 访问 
不 同 的 内 存 区 域 。 有 两 个 原因 说 明 这 样 的 设计 是 合理 的 : (a) 把 这 两 者 分 离 是 个 良好 的 编程 实 
Ek; (b) 绝 大 多 数 现代 的 处 理 融 (比如 说 第 7 草 将 要 讨论 的 Intel x86 体系 结构 里 采用 的 内 存 分 
段 机 制 ) 把 内 存 区 域 分 隔 成 不 同 区 域 ， 以 确保 程序 不 会 在 无 意 中 修 改 指 令 内 存 。 因 此 ， 我 们 
把 整个 内 存 分 成 LMEM ( 即 指令 内 存 ) 和 D-MEM ( 即 数 据 内 存 )， 以 使 得 取 指 令 和 执行 阶段 
互相 独立 。 现 在 ， 程 序 的 指令 来 自 IMEM， 程 序 所 操作 的 数据 结构 来 自 D-MEM。 因 此 , 我 
们 在 设计 上 就 消除 了 这 个 结构 性 冒险 。 

第 二 个 问题 意味 着 流水 线 的 每 个 阶段 所 需 的 执行 用 时 是 不 同 的 。 回 想 一 下 ， 比 尔 精心 设 
计 了 他 的 三 明治 流水 线 以 确保 每 个 雇员 在 他 的 柜台 上 所 做 的 工作 量 大 致 相当 。 这 里 的 缘由 是 
流水 线 上 最 慢 的 环节 限制 了 整个 流水 线 的 重 吐 量 。 因 此 ， 为 了 让 指令 流水 线 也 能 这 么 高 效 ， 
我 们 应 当 将 指令 执行 的 阶段 切 开 ， 使 得 各 个 阶段 所 做 的 工作 量 大 体 相 当 。 


5.10 修正 指令 流水 线 里 的 问题 


现在 来 考虑 解码 阶段 。 这 个 阶段 在 目前 的 设计 里 是 工作 量 最 小 的 一 个 阶段 。 为 了 让 工作 
量 更 加 平均 ， 我 们 必须 得 给 这 个 阶段 分 配 更 多 的 工作 。 这 里 面临 着 一 个 两 难 问 题 ， 即 我 们 在 
知道 指令 是 什么 之 前 ， 实 在 是 什么 都 做 不 了 -。 但 是 ， 我 们 可 以 投机 性 地 做 点 事 ， 只 要 不 影响 
§ 令 的 实际 语义 就 好 。 

我 们 认为 大 部 分 指令 都 会 用 到 寄存 器 里 的 值 。 因 此 ， 我 们 可 以 提前 从 寄存 需 堆 中 读 取 寄 
存 器 内 容 ， 而 不 必 实 际 了 解 到 底 是 什么 指令 。 在 最 坏 的 情况 下 ， 我 们 可 以 终止 使 用 从 寄存 需 
中 读 取 的 值 。 然 而 ， 为 了 能 如 此 做 ， 我 们 需要 知道 要 读 取 哪个 寄存 占 。 因 此 ， 在 设计 指令 集 
的 时 候 ， 指 令 格式 至 关 重 要 。 如 果 回 到 第 2 章 ， 看 一 看 LC-2200 里 面 用 的 寄存 器 的 指令 集 
(ADD, NAND, BEQ, LW, SW 和 JAL)， 你 会 发 现 表 示 源 寄存 器 的 位 ， 不 管 是 算术 /逻辑 
指令 的 还 是 内 存 地 址 的 ， 在 指令 的 格式 里 总 是 占 着 相同 的 位 置 。 我 们 可 以 利用 这 个 事实 ， 投 
机 地 在 解码 分 析 指 令 是 什么 类 型 的 同时 读 取 寄 存 占 。 根 据 同样 的 思想 ， 我 们 可 以 把 可 能 会 做 
很 多 工作 的 执行 阶段 拆 分 成 几 个 更 小 的 阶段 。 

现在 让 我 们 根据 以 上 的 论证 来 把 指令 的 处 理 过 程 划分 为 以 下 五 个 功能 性 组 件 ， 或 者 说 阶段 。 

s。 IF 此 阶段 把 PC 所 指向 的 指令 从 I-MEM 读 取 出 来 放 入 IR 中 ， 然 后 把 当前 的 PC 加 1 

以 为 取 下 一 条 指令 做 准备 。 

。 ID/RR 此 阶段 将 指令 解码 ， 并 把 正在 解码 的 指令 所 需要 的 寄存 器 的 值 从 寄存 器 堆 中 该 
出 。LC-2200 指令 集 有 单 操作 数 、 双 操作 数 及 三 操作 数 的 指令 。 但 是 ， 值 得 一 提 的 关键 
点 是 ， 任 何 一 条 指令 都 只 需要 至 多 两 个 寄存 器 的 值 。 例 如 ，ADD、NAND 和 BEQ 需要 
从 寄存 器 堆 中 读 取 两 个 源 操作 数 。 类 似 地 ，SW 需要 读 取 一 个 寄存 器 值 来 计算 地 址 ， 读 
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双 端 口 的 ， 也 就 是 说 在 同一 个 时 钟 周 期 内 可 以 同时 给 寄存 器 堆 两 个 寄存 器 地 址 而 读 取 

出 对 应 寄存 硕 的 值 。 我 们 把 这 样 的 一 个 寄存 器 堆 称 作 一 个 双 端 口 寄存 器 堆 (Dual-Ported 

Register File，DPRF)。 现 在 ， 震 要 传递 给 双 端 口 寄 存 需 堆 的 寄存 器 地 址 取决 于 指令 

型 ， 因 为 不 同类 型 (RÆ, LSA IR, BY 2.10.1 节 ) 的 指令 里 的 寄存 器 地 址 在 不 同 

的 部 分 。 这 不 是 个 问题 ， 因 为 我 们 可 以 用 组 合 逻辑 来 根据 指令 的 操作 码 字 段 在 IR 中 找 

出 表示 寄存 天 地址 的 部 分 。 因 为 这 个 阶段 既 包 含 解码 的 逻辑 ， 也 涉及 读 取 寄存 器 堆 ， 

我 们 就 给 它 了 一 个 混合 的 名 字 . 

。 EX 本 阶段 负责 处 理 所 有 指令 中 所 需 的 算术 和 逻辑 运算 。 你 会 在 $.11 节 中 看 到 ， 在 

EX 阶段 里 ， 一 个 ALU 可 能 不 足以 满足 所 有 指令 的 需求 。 

e MEM 本 阶段 对 于 SW Al LW 指令 分 别 负责 读 取 内 存 和 写 回 内 存 。 不 访问 内 存 的 指令 

不 需要 在 本 阶段 进行 操作 。 

。WB 本 阶段 对 于 需要 将 值 写 回 寄 存 器 的 指令 ， 执 行将 值 写 和 人 目的 寄存 器 的 操作 。 在 

LC-2200 中 需要 写 人 目的 寄存 融 的 指令 包括 算 木 /逻辑 运算 和 加 载 指令 。 

图 5-4 图 示 了 一 条 指令 穿 过 一 条 流水 线 的 过 程 。 类 似 于 我 们 心目 中 的 三 明治 流水 线 ， 我 
们 也 希望 每 条 指令 都 要 流 过 指令 流水 线 中 的 每 个 阶段 。 在 任何 时 间 ， 流 水 线 上 有 五 条 指令 下 
在 执行 ， 当 指令 1 在 WB 阶段 时 ， 指 令 I 在 I 阶段。 这 是 一 条 同步 流水 线 ， 因 为 在 每 个 时 钟 
脉冲 ， 每 条 指令 的 部 分 结果 都 被 传递 到 下 一 个 阶段 。 这 里 隐 含 的 假设 是 时 钟 周期 足够 长 ， 以 
至 于 流水 线 上 最 慢 的 部 分 也 足以 在 时 钟 周期 时 间 里 完成 它 的 功能 。 


指令 人 入口 ao iw 
I; k Ü lb l 


图 5-4 ”指令 经 过 流水 线 的 过 程 





每 个 阶段 都 以 前 一 个 时 钟 周期 计算 得 到 的 部 分 结果 为 基础 进行 工作 。 并 不 是 每 条 指令 都 
需要 每 个 阶段 ， 比 如 ADD 指令 并 不 需要 MEM 阶段 但是， 这 仅仅 意味 着 MEM 阶段 在 得 到 
ADD 指令 的 部 分 结果 时 的 这 个 时 钟 周 期 里 什么 也 不 做 。( 这 里 我 们 能 明显 看 出 它 和 三 明治 流 
水 线 的 类 似 之 处 。) 

你 也 许 在 看 了 特定 指令 的 执行 过 程 以 后 ,会 觉得 这 样 的 设计 是 低 效 的 。 比 如 说 ， 这 个 设 
计 给 ADD 指令 的 执行 白白 加 上 了 一 个 空转 的 周期 。 但 是 ， 这 个 流水 线 设计 的 目标 是 提升 指令 
处 理 的 吞吐 量 ， 而 不 是 减少 每 个 指令 的 延 时 。 回 到 三 明治 生产 线 的 例子 ， 其 中 类 似 的 标准 是 
保持 客户 排 的 队 移动 。 每 时 间 单 位 里 服务 的 顾客 数 就 类 似 于 流水 线 处 理 絮 里 每 个 时 间 单 位 里 
处 理 的 指令 条 数 。 

因为 每 个 阶段 在 处 理 不 同 的 指令 ,每 当 一 个 阶段 完成 它 的 工作 ， 它 就 必须 得 把 它 的 结果 
放 在 下 一 个 阶段 知道 的 某 个 地 方 ， 以 便 它 在 下 一 个 时 钟 周期 可 以 获取 这 个 结果 。 这 被 称 作 把 
一 个 阶段 的 结果 缓冲 起 来 。 缓 冲 机 制 对 于 各 个 阶段 的 独立 性 至 关 重 要 。 图 5-5 展示 了 添加 了 
缓冲 器 的 指令 流水 线 。 流 水 线 寄存 器 是 各 个 阶段 之 间 的 缓冲 器 的 常用 称呼 。 流 水 线 寄存 器 和 
缓冲 器 在 本 章 中 意义 相同 ， 可 以 互 换 使 用 。 在 我 们 的 三 明治 流水 线 的 例子 里 ， 部 分 完成 的 三 
明治 起 到 缓冲 器 的 作用 ， 给 予 各 个 阶段 以 独立 自主 . 
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5.11 指令 流水 线 的 数据 通路 元 件 


下 一 步 是 确定 流水 线 的 每 个 阶段 所 用 到 的 数据 通路 元 件 ， 以 及 各 个 阶段 之 间 的 用 于 提供 
隔离 的 缓冲 硕 的 内 容 。 
。 在 IF 阶段 我 们 需要 PC, ALU 和 IMEM。 这 个 阶段 的 输出 是 从 内 存 中 获取 的 指令 。 因 
此 ，IF 和 ID/RR 阶段 之 间 的 流水 线 寄 存 需 应 当 包 含 指 令 。 

。 在 ID/RR 阶段 ,我 们 需要 双 端 口 寄存 带 堆 : 本 阶段 的 输出 是 从 寄存 器 堆 里 读 取出 的 内 
容 ( 记 作 A 和 B) 和 指令 解码 的 结果 (指令 的 操作 码 ， 以 及 指令 可 能 包含 的 偏 移 量 )。 
这 些 就 是 ID/RR 和 EX 阶段 之 间 的 流水 线 寄 存 器 。 

。 EX 阶段 要 处 理 所 有 指令 所 需 的 算术 运算 。 因 为 这 是 唯一 一 个 要 为 指令 进行 算术 运算 的 

阶段 ， 我 们 需要 确定 最 坏 情况 下 这 个 阶段 所 需 的 资源 。 这 依赖 于 指令 集 。 

在 我 们 的 例子 (LC-2200 ) 里 ， 需 要 多 于 一 个 算术 操作 的 唯一 一 个 指令 是 BEQ 指令 。 
BEQ 指令 需要 一 个 ALU 来 进行 比较 (A==B)， 另 一 个 ALU 来 计算 有 效 地 址 (PC+ 带 符 号 的 
偏 移 量 )。 因 此 ， 我们 在 EX 阶段 需要 两 个 ALU. 

BEQ 指令 也 带 来 了 另 一 个 需求 。 计 算 地 址 的 算术 运算 需要 知道 对 应 于 BEQ 指令 的 PC 的 
fio (MEAE, PC 的 值 还 有 一 个 指令 也 需要 ， 即 JALR。) 因此 ，PC 的 值 也 应 当 被 从 前 一 个 
阶段 沿 着 流水 线 传 递 到 后 一 个 阶段 (连同 其 他 需要 传递 的 东西 ) 。 

EX 阶段 的 输出 是 算术 操作 的 结果 ， 也 取决 于 特定 的 指令 。EX 和 MEM 阶段 之 间 的 流水 
线 寄存 器 里 面 存储 什么 内 容 依赖 于 指令 。 比 如 说 ， 如 果 指 令 是 ADD， 那么 流水 线 寄 存 器 里 就 
会 包含 加 法 的 结果 、 操 作 码 ， 以 及 目的 寄存 器 描述 符 (Rx)。 我 们 可 以 看 出 ， 对 于 任何 一 条 指 
A, PC 的 值 在 EX 阶段 之 后 都 不 需要 了 。 处 理 其 他 指令 时 流水 线 寄存 器 里 面 要 存 什么 值 的 问 
题 就 留 给 读者 作为 练习 。 

。MEM 阶段 需要 访问 D-MEM。 如 果 某 个 时 钟 周期 里 本 阶段 处 理 的 指令 不 是 LW 或 SW， 

则 输入 缓冲 器 里 的 内 容 会 被 在 时 钟 周 期 结束 时 简单 地 复制 至 输出 缓冲 副 。 对 于 LW 指 
令 ， 本 时 钟 周期 的 输出 缓冲 器 要 包含 读 取 到 的 内 存 内 容 、 操 作 码 ， 以 及 目的 寄存 器 描 
述 符 (Rx)。 而 对 于 SW 指令 ,输出 缓冲 器 包含 操作 码 。 类 似 地 ， 我 们 也 容易 看 出 ， 如 
果 操 作 码 是 SW ATA, WB 阶段 里 什么 也 不 用 做 。 

© WB 阶段 要 用 到 寄存 器 堆 ( DPRF)。 这 个 阶段 只 与 要 写 和 人 值 到 目的 寄存 器 的 指令 (如 

LW, ADD 和 NAND) 有 关 。 这 带 来 了 一 个 有 趣 的 两 难 局 面 。 我 们 知道 每 个 时 钟 周 期 里 
每 个 阶段 都 在 处 理 不 同 的 指令 。 因 此 ， 参 见 图 5-4, WB 在 处 理 T 的 同时 ，ID/RR 在 处 理 
L,。 这 两 个 阶段 需要 处 理 不 同 的 指令 而 同时 访问 DPRF。( 例 如 , 1, 也许 是 ADD R1, R3, 
R4， 而 LE NAND R5，R6，R7。) 幸运 的 是 ，WB EESA A ar, M ID/RR 是 在 
读 取 。 因 此 ， 从 两 个 阶段 在 进行 的 逻辑 操作 的 角度 来 说 ， 并 没有 发 生 冲 突 。 并 且 ， 只 
要 被 读 和 写 的 寄存 器 不 是 同一 个 ， 两 个 操作 就 可 以 同时 进行 。 在 一 个 时 钟 周 期 里 同时 


Ab EP GE SS ite KAR ARSE BE ha 1K tt 121 


读 写 寄存 器 是 一 个 语义 冲突 ( 举 个 例子 ， 考 虑 中 是 ADD RI, R3, R4 mi LÆ ADD R4, 

R1, R6 的 情况 )。 很 快 ， 我 们 将 会 在 第 5.13.2 节 里 处 理 这 种 语义 冲突 。 

我 们 在 图 5-6 中 图 示 不 同 阶段 的 资源 的 新 的 组 织 结构 。 注 意 ID/RR 和 WB 阶段 里 提 到 的 
寄存 占 堆 是 数据 通路 里 的 同一 个 逻辑 元 素 。 在 图 5-6 中 ， 两 个 阶段 都 包含 了 寄存 器 堆 以 清楚 
地 展示 它们 所 需 的 资源 。 这 里 有 一 些 关 于 我 们 的 流水 线 处 理 器 设计 值得 一 提 的 事情 。 在 稳定 
状态 里 ， 有 五 条 不 同 的 指令 ， 分 别 在 流水 线 的 不 同 阶段 里 处 理 。 我 们 知道 ， 在 LC-2200 的 简 
单 设计 里 ， 有 限 状 态 机 要 穿 过 诸如 ifetch1 、ifetch2 等 这 样 的 微 状 态 。 在 一 个 给 定 的 时 钟 周期 
肉 ， 处 理 需 处 在 恰好 一 个 状态 里 。 而 在 流水 线 实现 里 ， 处 理 器 同时 属于 由 流水 线 的 不 同 阶段 
表示 的 状态 里 。 每 个 指令 要 用 五 个 时 钟 周期 来 执行 。 每 个 指令 都 从 IF 阶段 开始 进入 流水 线 ， 
在 WB 阶段 之 后 引退 ( 即 成 功 完成 )。 在 理想 情况 中 ,流水 线 处 理 器 每 个 时 钟 周 期 引退 一 条 指 
令 。 因 此 ， 流 水 线 处 理 需 的 等 效 CPI 为 1。 观 察 图 5-6， 你 可 能 会 猜想 MEM 阶段 应 当 是 最 慢 
的 。 但 是 ， 这 个 问题 的 答案 很 复杂 ， 我 们 将 把 关于 在 现代 处 理 需 内 减 小 时 钟 周 期 时 间 的 讨论 
留 到 第 5.15 节 。 





图 5-6 ”各 个 阶段 的 硬件 资源 的 组 织 


内 存 系统 对 于 流水 线 处 理 需 的 性 能 来 说 至 关 重 要 。 内 存 访 问 时 间 是 流水 线 处 理 需 的 延 时 
中 最 重要 的 部 分 。 为 了 隐藏 此 种 延 时 ， 处 理 硕 应 用 了 缓存 。 回 忆 一 下 第 2 章 中 提 到 的 工具 箱 
和 工具 托盘 的 类 比 。 我 们 提 到 过 ， 寄 存 需 起 到 了 工具 托盘 的 作用 ， 这 体现 在 我 们 通过 load 指 
令 ， 显 式 地 把 处 理 器 需要 的 内 存 中 的 值 加 载 到 寄存 副 中 。 类 似 地 ,缓存 起 到 了 隐 式 的 工具 托 
盘 的 作用 。 换 名 话说 ， 每 当 处 理 器 从 内 存 中 取出 点 什么 (指令 或 者 是 数据 ) 时 ， 它 隐 式 地 把 它 
放 人 一 个 处 理 器 的 高 速 的 存储 区 域 ， 这 个 存储 区 域 被 称 作 缓存 。 通 过 给 内 存 里 的 内 容 创建 隐 
式 的 拷贝 ， 处 理 器 随后 可 以 重用 该 内 存 地 址 里 的 值 ， 而 不 需要 再 次 从 内 存 里 获取 。 我 们 将 在 
第 9 章 讨 论 更 多 关于 缓存 的 细节 ， 包 括 它 对 流水 线 处 理 需 实现 的 影响 。 而 对 于 现在 的 关于 流 
水 线 处 理 器 实现 的 讨论 ,我 们 可 以 简单 地 认为 缓存 可 以 隐藏 内 存 延 时 ， 让 流水 线 处 理 器 实现 
变 为 可 行 。 尽 管 我 们 有 缓存 和 高 速 寄存 器 ， 组 合 逻辑 ( ALU、 多 路 选择 侣 、 解 码 絮 等) 的 延 
时 仍然 远 远 小 于 访问 缓存 以 及 通用 寄存 器 的 延 时 。 出 于 确保 所 有 阶段 的 延 时 大 体 相 当 的 目的 ， 
现代 处 理 器 的 实现 包含 了 远 远 多 于 五 个 阶段 。 例 如 ， 访 问 存 储 元 素 〈 缓 存 、 寄 存 顺 堆 ) 也 许 会 
在 流水 线 中 用 掉 多 个 时 钟 周 期 。 我 们 会 在 第 5.15 节 讨 论 这 类 问题 。 因 为 现在 是 对 处 理 需 流水 
线 实现 的 初次 介绍 ， 我 们 尽量 让 讨论 简洁 一 些 。 


5.12 ”针对 流水 线 的 体系 结构 与 实现 


针对 流水 线 的 体系 结构 设计 的 几 个 关键 点 如 下 : 

。 需 要 一 个 容易 解码 的 指令 格式 ”这 个 属性 使 得 实现 可 以 在 指令 完全 解码 之 前 就 做 一 些 
决定 。 一 个 对 称 的 指令 格式 是 一 个 具有 此 属性 的 例子 。 这 种 格式 确保 了 指令 里 的 特定 
字段 (如 寄存 器 描述 符 、 偏 移 量 的 大 小 和 位 置 等 ) 的 位 置 对 于 一 整 类 指令 (如 LC-2200 


ee -E ae 


中 的 R 类 指令 和 I 类 指令 ) 来 说 保持 不 变 ， 不 依赖 于 具体 是 什么 指令 。 我 们 已 经 看 到 ， 
这 是 我 们 在 LC-2200 的 ID/RR 阶段 里 利用 到 的 一 个 关键 属性 。 

。 需要 确保 每 个 阶段 的 工作 量 相 同 ”这 个 属性 确保 了 最 理想 的 时 钟 周期 时 间 ， 因 为 流水 
线 里 最 慢 的 环节 决定 了 它 
图 5-6a 展示 了 流水 线 的 LC-2200 实现 的 完整 数据 通路 。 





流水 线 
ar tf at 


图 $-6 a) 流水线 的 LC-2200 的 数据 通路 ， 展 示 了 各 阶段 之 间 的 所 有 联系 ， 以 及 各 阶 
段 所 要 用 到 的 资源 


5.12.1 指令 穿 过 流水 线 的 过 程 详解 


在 本 小 节 中 ， 我 们 将 会 跟踪 一 条 指令 穿 过 五 阶段 流水 线 的 全 过 程 。 我 们 给 相 邻 阶段 之 间 
isi] 的 寄存 器 分 别 取 专 有 的 名 称 ， 如 图 5-6b 所 示 。 
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图 5-6 b) 流水 线 寄存 器 的 专 有 名 称 。 每 个 阶段 输出 处 的 流水 线 寄存 右 包 含 着 指令 在 该 
阶段 执行 的 部 分 结 末 


K 5-2 总 结 了 每 个 阶段 之 间 的 流水 线 寄 存 需 的 功能 。 

让 我 们 来 考虑 一 下 ADD 指令 ， 它 具有 以 下 的 句法 和 格式 : 

ADD Rx, Ry, RZ; Rx < Ry + Rz 

每 个 阶段 分 别 执行 下 面 总 结 的 操作 ， 向 着 完成 这 条 加 法 指令 的 目标 做 贡献 。 

IF 阶段 (第 1 个 时 钟 周期 ): 

I-MEM[PC] -> FBUF /在 PC 这 个 内 存 地 址 存储 的 指令 被 取 到 FBUF 
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(其 实 FBUF 本 质 上 就 是 IR); 之 后 FBUF 的 内 容 
显示 在 图 5.6c) H., 
PC+1->PC /PC 加 一 


ID/RR 阶段 (第 2 个 时 钟 周期 ): 


DPRF[FBUF[Ry]] -> DBUF[A]; // #8 Ry £A DBUF[A] 

DPRF[FBUF[Rz]] -> DBUF[B]; // }E Rz iA DBUF[B] 

FBUF[OPCODE] -> DBUF[OPCODE];  // 把 操作 码 从 FBUF 拷贝 到 DBUF 

FBUF[Rx] -> DBUF[Rx] /把 Rx By FF art TFA. FBUF 拷贝 到 DBUF 


EX 阶段 (第 3 个 时 钟 周期 ): 

DBUF[A] + DBUF[B] -> EBUF[Result]; // 完成 加 法 

DBUF[OPCODE] -> EBUF[OPCODE]; // 把 操作 码 从 DBUF 拷贝 到 EBUF 
DBUF[Rx] -> EBUF[Rx]; /把 Rx AFF arta TT A. DBUF 拷贝 到 EBUF 


MEM 阶段 (第 4 个 时 钟 周 期 ): 


EBUF -> MBUF: // MEM 阶段 对 于 ADD 指令 的 执行 训 无 贡献 ， 所 
以 简单 地 把 EBUF 拷贝 进 MBUF. © 187 


WB 阶段 (第 5 个 时 钟 周期 ): 
MBUF[Result] -> DPRF[MBUF[Rx]];  / 把 加 法 运算 的 结果 写 和 由 寄存 器 描述 符 Rx 描 


RAY ay Fae P 
# 5-2 流水 线 缓冲 器 及 其 内 容 
名 称 各 阶段 的 输出 内 容 
FBUF 主要 包括 由 内 存 读 取 的 指令 
DBUF 解码 的 IR 和 从 寄存 器 堆 读 取 到 的 值 
EBUF 主要 包含 ALU 运算 结果 加 上 指令 的 其 他 部 分 ， 取 决 于 具体 指令 
MBUF MEM 如 果 指 令 不 是 LW 或 者 SW 的 话 与 EBUF 相同 。 如 果 指 令 是 LW 的 话 则 


缓冲 希 里 包含 内 存 指 定 地 址 中 的 内 容 
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图 5-6 c) LC 2200 加 法 指令 的 句法 和 格式 


只 考虑 ADD 指令 ， 定 量 分 析 流水 线 相 邻 阶段 的 各 个 缓冲 区 的 大 小 。 
答 : 
FBUF 的 大 小 (与 LC-2200 的 一 条 指令 的 大 小 相同 ) =32 位 
DBUF 的 大 小 : 
DBUF[A] 中 存储 的 Ry 寄存 器 的 内 容 的 大 小 =32 位 
DBUF[B] 中 存储 的 Rz 寄存 器 的 内 容 的 大 小 =32 位 


名” 此 处 原文 为 DBUFE， 应 为 EBUF。 一 -一 译 者 注 
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DBUF[opcode] 中 的 操作 码 = 4 位 
DBUF[Rx] 中 的 Rx 寄存 器 描述 符 的 大 小 = 4 fi 
总 大 小 (所 有 字段 之 和 ) =72 位 
EBUF 的 大 小 : 
EBUF[result] 中 的 加 法 结果 = 32 位 
EBUF [opcode] 中 的 操作 码 = 445 
EBUF[Rx] 中 的 Rx 寄存 器 描述 符 的 大 小 = 4% 
总 大 小 (所 有 字段 之 和 ) =40 位 
MBUF 的 大 小 (与 EBUF 相同 ) =40 位 


5.12.2 ”流水线 寄存 器 的 设计 


尽管 在 前 一 节 中 我 们 看 过 了 一 条 指令 是 如 何 穿 过 流水 线 的 ， 应 当 说 明 流 水 线 的 每 个 阶段 
在 每 个 时 钟 周期 里 都 在 处 理 不 同 的 指令 。 读 者 应 当 和 弄 懂 针对 LC-2200 的 不 同 指令 在 流水 线 每 
个 阶段 所 采取 的 行动 。( 参 见 本 章 结尾 处 的 练习 题 .) 这 个 练习 类 似 于 我 们 在 第 3 章 中 对 LC- 
2200 的 串 行 实现 的 有 限 状态 机 的 设计 。 在 设计 完成 之 后 ， 每 个 阶段 的 流水 线 寄 存 器 的 尺寸 可 
定 为 任何 指令 执行 所 需 的 流水 线 寄存 器 尺寸 的 最 大 值 。 在 ID/RR 输出 处 的 流水 线 寄存 器 将 会 
ee 因为 我 们 还 不 知道 指令 是 什么 。 对 于 流水 线 寄存 器 的 这 些 内 容 的 解读 取决 于 

是 哪个 阶段 ， 以 及 该 阶段 在 处 理 的 指令 的 操作 码 。 

一 个 通用 的 流水 线 寄存 器 布局 如 图 5-6d 所 示 。 操 作 码 永远 占用 着 每 个 流水 线 寄 存 器 的 相 
同位 置 。 在 每 个 时 钟 周 期 里 ， 每 个 阶段 依据 操作 码 解 读 流水 线 寄存 器 的 其 余部 分 ， 并 采取 相 
应 的 数据 通路 动作 (类似 于 我 们 在 5.12.1 节 里 为 ADD 指令 所 做 的 详细 说 明 D 


图 5-6 d) 流水 线 寄存 融 的 通用 布局 
为 LC-2200 设计 DBUF 流水 线 寄存 器 。 不 要 试图 通过 重 载 该 寄存 器 的 不 同 字段 的 方式 来 优化 设计 。 


DBUF 有 以 下 字段 : 


操作 码 (所 有 指令 都 需要 ) 4 位 
A (R 类 指令 需要 ) 32 位 
B (R 类 指令 需要 ) 32 位 
偏 移 量 (1 类 和 J 类 指令 需要 ) 20 位 
PC 的 值 (BEQ 需要 ) 32 位 
Rx 寄存 器 描述 符 (R、I、J 类 指令 需要 ) 4 位 
DBUF 流水 线 寄存 器 的 布局 : 
ee 
4 位 32 位 32 位 20 位 32 位 
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5.12.3 各 个 阶段 的 实现 


在 某 种 意义 上 ,设计 和 实现 一 个 流水 线 处 理 器 可 能 比 实现 一 个 非 流 水 线 处 理 器 还 要 简单 。 
这 是 因为 流水 线 的 实现 将 设计 给 模块 化 了 。 这 样 的 模块 化 带 来 了 和 把 一 个 大 的 软件 系统 分 解 
为 奋 干 个 小 模块 一 样 的 好 处 。 正 如 大 软件 团队 开发 复杂 软件 系统 (如 微软 Word) 时 的 情况 一 
伴 ， 流 水 线 处 理 需 的 模块 化 使 得 多 个 独立 的 硬件 团队 协同 实现 处 理 器 成 为 可 能 ， 其 中 每 个 团 
队 负 责 处 理 融 的 特定 阶段 。 流 水 线 寄 存 器 的 布局 和 解读 类 似 于 大 型 软件 系统 里 定义 良好 的 组 
件 间 接口 。 在 完成 了 流水 线 寄存 器 的 布局 和 解读 之 后 ， 我 们 就 在 完全 隔绝 于 其 他 阶段 的 情况 
下 完成 数据 通路 操作 。 更 进一步 地 说 ， 因 为 每 个 阶段 的 数据 通路 操作 都 在 一 个 时 钟 周期 中 完 
成 ， 整 个 阶段 的 设计 完全 是 组 合 逻辑 。 在 每 个 时 钟 周 期 开始 时 ， 每 个 阶段 解读 输入 的 流水 线 
寄存 锅 ， 用 组 合 逻 辑 来 进行 数据 通路 操作 ， 再 把 数据 通路 操作 的 结果 写 人 它 的 输出 流水 线 寄 
AF tit o 
CED 设计 并 实现 LC-2200 指令 集 的 流水 线 中 的 ID/RR PE. TE ee 
辑 设计 来 完成 此 题 ， 

A 


图 5-6、 图 5-6a 和 图 5-6b 是 解决 此 题 的 基础 。 数 据 通路 元 素 已 经 放置 好 。 根 据 指 令 的 格式 ， 读 
取 寄 存 器 推 所 得 到 的 值 会 被 放 入 DBUF 的 相应 字段 中 ; 指令 的 偏 移 量 和 操作 码 字 段 要 从 FBUF 拷贝 到 
DBUF 中 ; PC 的 值 要 被 放 入 DBUF 的 相应 字段 中 。 剩 下 部 分 留 给 读者 作为 练习 。 


5.13 冒险 


尽管 三 明治 流水 线 对 于 流水 线 处 理 硕 来 说 是 个 很 好 的 类 比 物 ， 指 令 流 水 线 中 还 是 有 一 些 
额外 的 问题 ， 这 些 问题 让 它 的 设计 变 得 复杂 。 这 些 问题 被 统称 为 流水 线 冒 险 。 具 体 来 说 ， 有 
三 类 冒险 : 结构 性 冒险 、 数 据 冒 险 和 控制 冒险 。 

我 们 很 快 就 会 看 到 ， 所 有 的 冒险 的 效果 都 一 样 ， 也 就 是 它们 会 降低 流水 线 的 效率 。 换 名 
话说 ， 流 水 线 会 每 个 时 钟 周期 执行 少 于 一 条 指令 。 但 是 ， 回 想 一 下 ， 流 水 线 是 同步 的 ， 也 就 
是 说 每 个 时 钟 周 期 每 个 阶段 都 在 处 理 上 个 阶段 刚刚 放 进 流水 线 寄存 器 的 指令 。 正 如 水 管 中 的 
气泡 ， 如 果 一 个 阶段 无 法 发 送 一 个 合法 指令 给 下 一 个 阶段 ， 它 就 应 当 把 一 个 等 价 于 “气泡 ”， 
即 一 个 什么 都 不 做 的 空 指令 传递 过 去 。 我 们 把 这 个 称 作 NOP (no-operation， 无 操作 ) 指令 。 

我 们 将 会 在 处 理 需 的 指令 集中 加 入 一 种 空 指令 。 在 接 下 来 的 关于 冒险 的 讨论 中 ， 我 们 将 
讨论 硬件 如 何 根据 遇 到 的 冒险 自动 产生 这 些 NOP. 但是， 这 不 是 唯一 的 办 法 。 通 过 把 流水 线 
暴露 给 软件 ， 我 们 可 以 让 系统 软件 一 一 即 编译 需 一 一 负责 在 代码 中 添加 这 些 NOP。 我 们 将 在 
5.13.4 节 中 再 讨论 这 种 可 能 性 

另 一 种 理解 流水 线 中 气泡 效果 的 方式 是 认识 到 指令 的 平均 CPI 是 大 于 1 的 。 有 必要 对 于 
使 用 CPI 的 记号 加 上 一 个 警告 : 回忆 一 下 程序 的 执行 时 间 ， 如 果 以 时 钟 周期 数 计 的 话 ， 是 
CPI 与 总 共 执 行 的 指令 数 的 乘积 。 因 此 ，CPI 本 身 并 不 能 完全 说 明 某 体系 结构 或 者 它 的 某 一 实 
现 效 果 有 多 好 。 实 际 上 ， 编译 器 和 体系 结构 互相 合作 ， 共 同 确定 了 程序 的 执行 时 间 。 比 方 说 ， 
一 个 编译 器 生成 的 未 优化 代码 的 CPI 也 许 会 比 优 化 后 的 代码 低 一 点 ,但 是 执行 时 间 可 能 要 比 
优化 后 的 代码 长 很 多 。 原 因 是 编译 器 的 优化 阶段 可 能 已 经 去 掉 了 大 量 无 用 指令 ， 也 就 减少 了 
总 共 执 行 的 指令 数 。 但 这 可 能 是 以 增加 了 三 类 冒险 出 现 的 次 数 为 代价 的 ， 因 此 ， 优 化 指令 的 
平均 CPI 也 就 上 升 了 。 但 是 ， 优 化 代码 的 净 效 果 仍然 可 能 是 执行 时 间 减 少 。 
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5.13.1 结构 性 冒险 


我 们 以 前 在 提 及 不 同 阶段 并 发 操作 的 可 用 人 硬件 资源 的 限制 时 提 到 过 结构 性 冒险 。 例 如 说 ， 
在 非 流 水 线 版 本 里 单一 数据 总 线 就 是 流水 线 实现 的 一 个 结构 性 冒险 。 类 似 地 ， 单 一 的 ALU 是 
男 一 个 结构 性 冒险 。 对 于 此 种 问题 有 两 种 解决 方案 : 一 种 是 接受 它 的 存在 ， 一 种 是 修复 它 。 
如 果 估 计 这 种 冒险 很 罕见 (比如 只 针对 某 个 特定 的 同时 穿 过 流水 线 的 指令 组 合 )， 那 么 可 能 不 
浪费 硬件 资源 来 修复 是 比较 划算 的 。 作 为 一 个 例子 我们 不 妨 假 设 我 们 的 尖 头 发 老板 9 告诉 我 
们 ， 我 们 必须 只 能 在 EX 单元 里 使 用 一 个 ALU。 那么 ， 每 一 次 遇 到 BEQ 指令 ， 我 们 得 花 两 个 
时 钟 周期 在 EX 阶段 里 ， 以 处 理 所 需 的 两 个 算术 操作 ， 一 个 用 于 比较 ， 另 一 个 用 于 计算 地 址 。 
当然 ， 得 设法 让 前 后 的 阶段 知道 EX 阶段 偶尔 会 花 两 个 时 钟 周期 进行 操作 。 因 此 ，EX 单元 应 
当 告 诉 它 前 面 的 阶段 ( 即 IF 和 ID/RR) 在 下 个 时 钟 周期 别 发 送 新 指令 过 来 。 简 单 地 说 ， 就 是 
需要 一 个 反馈 线路 ， 每 个 之 前 的 阶段 通过 反馈 线路 里 的 内 容 来 确定 是 否 应 当 在 当前 阶段 里 暂 
停 ， 还 是 应 该 做 点 有 用 的 事情 。 如 果 一 个 阶段 决定 在 某 个 时 钟 周 期 暂停 ， 它 只 需 不 改变 输出 
寄存 硕 的 值 就 好 了 了- 

而 之 后 的 阶段 需要 用 跟 之 前 阶段 不 同 的 方式 来 处 理 。 有 具体 来 说 ，EX 阶段 将 会 在 它 的 输出 
缓冲 器 的 操作 码 字 段 里 写 和 人 一 个 NOP 操作 码 。NOP 指令 是 让 处 理 器 执行 一 条 对 实际 要 执行 
的 程序 没有 影响 的 空 指令 的 便利 方式 。 通 过 NOP 指令 ,我们 在 流水 线 里 BEQ 指令 和 之 前 一 
条 指令 之 间 引 入 了 一 个 气泡 。 

图 5-7 以 一 系列 时 间 点 的 示意 图 展示 了 BEQ 指令 的 执行 过 程 。 我 们 从 第 2 个 时 钟 周期 开 
始 ， 此 时 BEQ 指令 处 在 ID/RR 阶段 。 反 馈线 路 上 的 值 为 STAY (二 进 制 的 1 )， 告 诉 之 前 的 阶 
段 留 在 同一 条 指令 ， 而 不 要 在 时 钟 周期 结束 时 把 指令 发 送出 去 。 流 水 线 中 这 样 的 气泡 的 存在 
降低 了 流水 线 的 效率 ， 因 为 气泡 使 得 流水 线 的 等 效 CPI 升 到 了 1 以 上 。 

另 一 方面 ， 如 果 这 样 的 效率 损失 被 认为 是 不 可 接受 的 ,我们 可 以 通过 添加 硬件 来 解决 结 
构 性 冒险 。 这 就 是 我 们 在 之 前 讨论 在 EX 阶段 添加 一 个 额外 ALU 来 解决 结构 性 冒险 时 所 做 的 
事情 。 

这 里 有 三 个 关于 术语 的 备注 : 

。 指令 不 能 进入 下 一 阶段 的 时 候 称 作 指令 被 拖延 了 。 

© 拖延 的 结果 是 流水 线 中 被 引入 一 个 气泡 。 

。 气泡 在 流水 线 中 表现 为 一 个 NOP 指令 。 一 个 执行 NOP 指令 的 阶段 在 这 个 时 钟 周期 里 

什么 都 不 做 。 它 的 输出 缓冲 需 与 上 一 个 时 钟 周 期 相 比 不 会 改变 。 

你 可 能 会 发 现 ,我 们 在 本 书 中 ,拖延 、 和 气泡 和 NOP 可 互 换 使 用 ， 它 们 都 表示 相同 的 东西 。 


5.13.2 数据 冒险 


考虑 图 5-8a。 在 第 一 个 式 子 中 ,注意 两 条 指令 在 程序 中 出 现 的 顺序 。1 ERAT ae R2 和 
R3 的 值 ， 然 后 将 加 法 的 结果 写 人 寄存 器 R1。 后 一 条 指令 了 则 读 取 RI (刚刚 由 前 一 条 指令 I 
BGA) 和 Rs 中 的 值 ， 并 把 加 法 的 结果 写 人 R4。 这 种 情况 就 是 数据 冒险 ， 因 为 这 两 个 指令 
间 存 在 依赖 关系 。 更 加 细 分 的 话 ， 这 种 冒险 称 作 写 后 读 (RAW, Read After Write) 数据 冒险 。 
当然 了 ， 这 两 个 指令 并 不 需要 严格 地 挨 在 一 起 ， 只 需要 按照 执行 顺序 执行 的 时 候 存 在 对 数据 
的 依赖 关系 ， 就 构成 了 一 个 数据 冒险 。 
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第 2 个 时 钟 周期 





反馈 线路 





第 4 个 时 钟 周期 





第 5 个 时 钟 周期 





反馈 线路 
图 5-7 结构 性 冒险 图 解 


还 有 另外 两 种 类 型 的 数据 冒险 。 图 5-8b 中 的 情形 被 称 作 读 后 写 (WAR, Write After 
Read) 数据 冒险 ，L 向 寄存 器 写 人 一 个 值 ， 而 工 从 同一 个 寄存 器 读 出 一 个 值 。 图 5-8c 中 
的 情形 被 称 作 写 后 写 (WAW, Write After Write) 数据 冒险 ， L 要 写 入 的 寄存 带 也 是 前 一 
条 指令 写 入 的 目标 。 

这 里 是 个 很 好 的 强调 硬件 和 软件 之 间 联 系 的 地 方 。 RAW. WAR 和 WAW 冒险 是 处 理 回 流 
水 线 的 属性 。 但 是 ， 这 些 冒 险 在 程序 执行 时 的 出 现 依赖 于 程序 本 身 的 固有 属性 。 导 致 这 些 冒 
险 的 程序 属性 分 别 是 流 依赖 、 反 依赖 以 及 输出 依赖 。 

我 们 定义 这 些 术 语 如 下 : 

1 ) 语句 S2 在 满足 下 列 两 个 条 件 的 情况 下 被 称 作 流 依赖 (或 真 依赖 ) 于 S1: 

。S1 在 执行 顺序 中 位 于 S2 之 前 
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。S1 修改 了 一 个 S2 读 取 的 资源 
2) 语句 S2 在 满足 下 列 两 个 条 件 的 情况 下 被 称 作 反 依 赖 于 S1: 
。S1 在 执行 顺序 中 位 于 S2 之 前 
。S2 修改 了 一 个 S1 读 取 的 资源 
3 ) 语句 S2 在 满足 下 列 两 个 条 件 的 情况 下 被 称 作 输 出 依赖 于 S1: 
e S1 在 执行 顺序 中 位 于 S2 之 前 
° S1 和 S2 修改 了 同一 个 资源 
l: R1 二 R2 + R3 
(5-7) 
lp: R4<R1 + RS 
图 5-8 a) 写 后 读 冒 险 
l: R4-R1 +R5 
(5-8 ) 
l>: R1 + R2 + RB 
图 5-8 b) 读 后 写 冒 险 
li:R1¢- R4+R5 
( 5-9 ) 


l2: R1 + R2 + R3 


图 5-8 0) 写 后 写 冒 险 


编译 硕 进 行 数 据 依赖 分 析 来 识别 这 些 程 序 属性 ， 然 后 如 果 需 要 的 话 ， 通 过 重新 排列 指令 
来 减少 数据 依赖 对 流水 线 处 理 融 带 来 的 负面 效果 。 

如 果 指 令 按照 程序 顺序 如 同 在 一 个 非 流水 线 处 理 需 那 般 一 个 接着 一 个 执行 的 话 ， 这 些 数 
据 依赖 不 会 造成 任何 问题 。 但 是 ,它们 可 能 会 在 流水 线 处 理 天 中 引起 问题 ， 这 将 会 在 下 一 段 
进行 解释 。 我 们 发 现 ， 对 于 我 们 考虑 的 简单 流水 线 ，WAR 和 WAW 冒险 不 会 造成 什么 问题 ， 
我 们 将 会 在 随后 讨论 解决 它们 的 方案 。 我 们 首先 来 处 理 写 后 读 冒 险 。 

写 后 读 冒 险 ” 让 我 们 来 跟 踊 图 5-8a Pst (5-7) 所 表示 的 指令 序列 流 过 流水 线 的 过 程 : 


l2 li 


4 1, 在 流水 线 的 EX 阶段 时 ,J 正 处 在 ID/RR 阶段 ， 即 将 读 取 寄 存 器 R1 A RS 的 值 。 这 
里 就 有 问题 了 ， 因 为 1 还 没有 计算 出 RI 的 新 值 呢 。 实 际 上 , L 只 有 执行 到 WB 阶段 才 会 把 
新 计算 的 值 写 回 到 RI 寄存 器 中 。 如 果 工 被 允许 读 取 RI1 中 的 内 容 ， 如 上 图 所 示 的 情况 ， 就 会 
让 整个 程序 的 执行 出 错 。 我 们 把 这 种 程序 的 本 意 与 实际 执行 结果 不 符合 的 情况 称 作 语 义 不 一 
致 。 在 非 流 水 线 的 实现 里 绝对 不 会 有 这 样 的 问题 ， 因 为 它 一 次 只 执行 一 条 指令 。 

如 果 两 条 指令 并 不 是 一 个 紧 接 着 一 个 的 话 ， 问 题 也 许 没 那么 严重 。 

比如 说 ， 考 虑 以 下 的 序列 : 

I); RI — R2 + R3 
lx: R8 — R6 + R7 
lz: R4 — R1 + RS 


”此 处 原文 把 S2 误 写 成 了 Sle 一 一 译 者 注 
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这 种 情况 下 ， 流 水 线 看 起 来 如 下 图 : 


l> l lı 


L 已 经 执行 完毕 。 但 是 ， 只 有 在 了 达到 WB 阶段 时 才 会 把 新 的 R1 的 值 写 入 寄存 器 。 因 
此 ， 如 果 之 后 的 三 条 指令 中 任 一 条 存在 写 后 读 冒 险 ， 就 会 导致 语义 不 一 致 。 


考虑 下 面 四 个 指令 的 序列 : 
L: LW R1, 内 存 地 址 


caries a 


l: R4<— R1+R5 
I 和 1 被 两 条 不 相关 指令 间隔 ， 如 上 图 所 示 。 流 水 线 执行 此 指令 序列 需要 插入 多 少 个 气泡 ? 

答 : 

L 达到 ID/RR 阶段 时 流水 线 的 状态 如 下 图 : 


l4 . 


a SEN h 
eHe 
Ti 要 到 当前 周期 结束 时 才 会 把 值 写 入 R1 Po Ah, L 在 这 个 时 钟 周 期 里 读 取 寄存 器 的 话 是 不 能 
得 到 正确 结果 的 。 
因此 ， 要 有 1 个 周期 的 延 时 ， 也 就 需要 播 入 一 个 气泡 (由 ID/RR 阶段 传递 给 EX 阶段 一 个 NOP 
指令 )。 


ls NOP ari rT 
例 5-12 
EX WB 


l: R1 & R2 + R3 
is x H vem j we 
l4; R6 << R1 + RE 
如 上 图 所 示 ， 指 令 序列 了 到 I 即将 进入 该 五 级 流水 线 。 
a. 在 下 表 中 写 出 指令 逐步 流 过 流水 线 直 到 全 部 四 条 指令 都 执行 完毕 且 引 退 的 整个 过 程 。 从 流水 
线 中 引退 是 指 一 条 指令 不 处 在 五 个 阶段 中 的 任何 一 个 。 
答 : 
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b. 假设 程序 只 包含 这 四 条 指令 ， 在 之 前 的 执行 中 的 平均 CPI 是 多 少 ? 
答 : 用 了 九 个 时 钟 周期 引退 了 四 条 指令 ， 因此， 这 几 条 指令 的 平均 CPI 昨 
平均 CPI = 9/4 = 2.25 


解决 写 后 读数 据 冒 险 : 数据 前 递 ”解决 这 个 问题 的 一 个 简单 方法 类 似 于 解决 结构 性 冒 
险 ， 我 们 简单 地 把 导致 写 后 读 冒 险 的 指令 拖延 在 ID/RR 阶段 直到 寄存 占 的 值 已 经 可 用 为 止 。 
在 图 5-8a 的 式 (5-7) 中 展示 的 情形 里 ，ID/RR 阶段 保持 工 三 个 时 钟 周期 ， 直 到 了 从 流水 线 
引退 。 在 这 三 个 时 钟 周期 内 ， 气 泡 (以 ID/RR Riž NOP 指令 的 形式 ) 被 塞 进 流水 线 里 。 出 

于 同样 的 原因 ， 之 前 的 阶段 (IF) 被 告知 停留 在 同一 条 指令 上 不 取 新 指令 
192 图 5-9 中 一 系列 的 图 示 展 示 了 流水 线 由 于 图 5-8a 中 式 (5-7) 的 数据 冒险 所 引起 的 延 时 。 


(a) 


(b) 








R1 还 不 能 读 取 
193 图 5-9 图 5-8 的 式 (5-7) 中 的 写 后 读 冒 险 


RE BI GED HARA Eg tf 


NOP 


lo NOP 
组 组 组 组 
器 fit 器 fit 


Reg-file 


R1 已 经 可 以 读 取 
图 5-9 ( 续 ) 
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(d) 


在 下 图 中 展示 的 时 钟 周期 里 ，IF 阶段 将 会 正常 执行 ， 开 始 读 取 新 的 指令 。 


NOP NOP 


G Ea EZ Nem cS 
l 
lp NOP 


ID/RR 阶段 需要 硬件 帮助 以 确定 它 需 要 拖延 。 检 测 这 一 点 所 
需 的 硬件 十 分 简单 。 在 图 5-10 中 所 展示 的 寄存 器 堆 里 ，B 位 就 
是 寄存 器 的 忙 位 ， 每 个 寄存 器 都 有 一 个 这 样 的 位 。ID/RR 阶段 确 
定 指令 的 目标 寄存 器 之 后 就 在 寄存 器 堆 里 把 相应 寄存 需 的 B 位 
设 为 1。 图 中 的 工 应 当 已 经 把 Rl 的 B 位 设 成 1 了 。WB 阶段 则 
负责 在 把 新 值 写 入 寄 存 器 堆 的 同时 把 对 应 的 B 位 设 回 0。 因此 ， 
当 到 达 ID/RR 阶段 时 ， 它 会 发 现 R1l 的 B 位 被 设置 了 ， 也 就 
会 自己 一 直 拖延 到 三 个 时 钟 周 期 之 后 BMRA A LIE. 

让 我 们 来 看 看 如 何 能 摆脱 写 后 读 冒 险 带 来 的 拖延 。 我 们 可 
能 没 法 完全 摆脱 掉 这 种 拖延 ， 但 是 当然 可 以 通过 略微 增加 硬 
件 的 复杂 性 来 最 小 化 拖延 的 次 数 。 原 始 的 算法 以 它 的 发 明 者 
Tomasulo 命名 ， 在 20 世纪 60 年 代 的 IBM 360/91 Xb H at EWJ 
次 使 用 。 想 法 很 简单 ， 概 括 来 说 ， 给 寄存 器 生成 新 值 的 阶段 检 
查 一 遍 是 否 有 其 他 阶段 正在 等 待 这 个 值 。 如 果 是 ， 它 就 把 这 个 
值 前 递 给 需要 这 个 值 的 阶段 。。 

考虑 我 们 的 简单 流水 线 ， 唯 一 会 读 取 寄 存 需 的 阶段 是 ID/ 
RR 阶段 。 让 我 们 来 检查 一 下 需要 做 什么 来 使 用 数据 前 递 。 
我 们 给 寄存 器 堆 里 面 的 每 个 寄存 器 增加 一 个 称 作 RP ( Read 
Pending， 等 待 读 取 ) 的 位 (参见 图 5-11). 

当 指令 进入 ID/RR 阶段 时 ， 如 果 它 试图 读 取 的 寄存 器 的 忙 
位 被 设置 成 1 了， 那么 它 就 把 该 寄存 器 的 等 待 读 取 位 也 设置 成 
1。 如 果 EX、MEM 或 者 WB 阶段 中 的 任何 一 个 发 现 它 计算 新 
值 的 目标 寄存 器 的 等 待 读 取 位 是 1， 它 就 把 生成 的 值 提供 给 ID/ 
RR 阶段 。 由 于 必须 得 有 线 缆 从 这 些 阶段 走 回 ID/RR 阶段 ， 便 





图 $-10 ”寄存 器 堆 里 每 个 寄 


存 器 市 着 一 个 忙 位 





图 5-11 


寄存 器 堆 里 每 个 寄 
存 嚣 带 着 一 个 忙 位 
和 一 个 等 待 读 取 位 


日 ”我 们 所 讲 到 的 为 简单 流水 线 避 免 写 后 读 冒 险 而 采用 的 算法 是 受 Tomasulo 算法 启发 得 到 的 ,但 是 远 不 及 原 


始 的 算法 那么 具 通 用 性 。 
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件 就 复杂 起 来 了 。 人 们 可 能 会 问 ， 为 什么 不 直接 让 这 些 阶 段 在 等 待 读 取 位 是 1 的 时 候 把 值 写 
nl ae Fae HEE? 原则 上 说 ， 当 然 可 以 这 么 做 ; 但 是 ， 正 如 我 们 之 前 所 说 的 ， 写 入 寄存 器 堆 以 
及 将 忙 位 清 零 是 WB 阶段 的 职责 。 如 果 让 所 有 的 阶段 都 能 写 和 人 寄存 器 堆 的 话 ， 硬 件 的 复杂 性 
就 会 增加 。 而 且 ， 这样 增 加 的 额外 硬件 并 不 能 带 来 任何 性 能 的 提升 ， 因 为 在 ID/RR 阶段 的 指 
令 需 要 数据 时 反正 也 能 通过 数据 前 递 获得 。 
回头 再 看 看 图 5-8a 中 的 写 后 读 冒 险 ， 我 们 看 到 数据 前 递 能 完全 消除 气泡 ， 如 图 5-12 所 示 。 
考虑 以 下 指令 序列 : 





RI 还 未 准备 好 ， 不 能 读 取 
图 5-12 ”用 数据 前 递 9 来 解决 图 5-8a 中 的 写 后 读 冒 险 


这 里 如 果 I 是 一 条 为 某 个 寄存 需 产 生 新 值 的 算术 / 逻辑 指令 ， 而 随后 的 三 条 指令 (I,、、 
L) 中 的 任何 一 条 需要 该 值 ， 则 前 递 将 会 消除 由 写 后 读 冒 险 产生 的 拖延 。 表 5-3 SS aE 
和 不 带 前 递 的 流水 线 对 于 图 5-8a 中 的 写 后 读 冒 险 所 需要 插入 的 气泡 个 数 与 和 之 间 不 相关 
指令 条 数 的 关系 。 


表 5-3 图 5-8a 中 写 后 读 冒 险 产 生 的 气泡 个 数 


L1 和 1 2 之 间 的 无 关 指令 条 数 用 前 递 时 的 气泡 个 数 
o o 
0 
2 | i 
3 或 更 多 bonn | 0 


这 里 的 指令 序列 与 例 5-12 中 的 一 样 。 假 设 采用 了 数据 前 递 ， 在 下 表 中 给 出 指令 的 执行 过 程 。 
这 些 指令 的 平均 CPI 是 多 少 ? 


l: R1 < 一 R2 + R3 

TERG HeHeHeH H 
l: R5} R5+R3 "I, 

l4: R6 = R1 + R6 


答 : 参见 表 5-3， 使 用 数据 前 递 以 后 ， 算 术 /逻辑 指令 带 来 的 写 后 读 冒 险 将 不 需要 播 入 气泡 ， 因 为 


日 ”前 递 听 起 来 很 反 直 觉 ， 因 为 箭头 在 向 回 指 ! 但 是 这 个 可 以 这 么 理解 : 在 程序 的 执行 顺序 里 ,I 是 在 1 的 前 


面 ， 而 把 值 前 递 给 了 1。 
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从 每 个 阶段 都 可 以 数据 前 递 到 之 前 的 阶段 。 因 此 ， 从 下 表 可 以 看 出 来 ， 给 定 的 执行 序列 里 没有 气泡 。 





平均 CPI=8/4=2 


处 理 读 取 内 存 的 指令 引入 的 写 后 读 冒 险 ” 读 取 内 存 的 指令 也 会 引入 数据 冒险 。 考 虑 以 下 
指令 序列 : | 


l: LW R1, 0(R2) 


l: ADD R4, R1, R4 ( 5-10 ) 


在 这 种 情况 下 ，R1 的 新 值 直到 MEM 阶段 才 可 用 。 因 此 ， 如 果 读 存 指令 读 取 的 值 在 紧 
接着 的 指令 中 会 用 到 ， 就 算 用 上 前 递 ， 一 个 时 钟 周期 的 拖延 也 无 可 避免 ， 如 式 ( 10 ) 所 示 。 
例 5-14 会 详细 介绍 处 理 读 取 内 存 的 指令 在 流水 线 中 引入 的 气泡 。 


考虑 以 下 指令 序列 : 


ew mn | mem > wo i 
a. 如 图 , I, 紧 跟着 ho BREA EZ) ID/RR 阶段 ， 之 前 的 执行 将 会 产生 多 少 个 气泡 ? 
b. 如 果 没 有 寄存 器 前 递 的 话 ， 前 面 的 执行 将 会 产生 多 少 个 气泡 ? 
Z. 
a. L 达到 ID/RR 阶段 时 的 流水 线 状 态 如 下 : 


h h 
= 
L RAZ MEM 阶段 结束 时 才 有 RI 的 值 。 因 此 ， 有 一 个 周期 的 延 时 ， 也 就 有 一 个 气泡 (ID/RR 


阶段 传递 给 EX 阶段 的 NOP 指令 )， 如 图 : 


NOP | 


l2 


MEM 阶段 将 会 同时 将 它 的 结果 写 入 它 的 输出 缓冲 器 (MBUF) FHHANFEANS RIGS 
的 值 前 递 给 ID/RR 阶段 ， 使 得 ID/RR 阶段 可 以 把 该 值 (用 于 了 ) SA ID/RR 阶段 的 输出 的 流水 线 寄 
存 器 (DBUF) 里 。 因 此 ， 之 后 流水 线 就 没有 延 时 了 ， 尺 管 Ti 只 在 WB 阶段 结束 时 将 值 写 入 Rl。 下 
图 展示 了 这 两 条 指令 在 流水 线 里 的 执行 情况 。 
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Rw 
Or 
‘Re 





因此 ， 整 个 执行 流程 在 有 前 说 的 情况 下 的 气泡 数 是 1。 
b. 没有 前 弟 的 话 , LELZASARIZHWEFHEERRIW. SARI 要 等 到 WB 阶段 结束 。 
注意 写 入 Rl1 的 值 只 有 在 下 一 个 时 钟 周期 才 可 读 取 。 下 表 展 示 了 这 两 条 指令 在 流水 线 里 的 执行 情况 。 








1 = 3 2 s 
2 Is h = = = 
3 la a 2 
4 l4 ? = 
5 n NOP | |, 
6 = NOP | NOP 
7 i NOP | NOP 
8 =- |= ~ l> NOP 
9 IAJ à = lo 


因此 ,不 用 前 说 执行 这 两 条 指令 所 产生 的 气泡 数 =3。 


表 5-4 总 结 了 由 于 庶 取 内 存 的 指令 产生 的 写 后 谈 冒 险 在 有 和 没有 数据 前 递 的 情况 下 ， 对 
于 每 种 1 和 了 之 间 的 无 关 指 令 条 数 ， 分 别 引 入 的 气泡 个 数 . 


5-4 读 内 存 指令 引起 的 写 后 读 冒 险 导 致 的 流水 线 中 的 气泡 





I, Al 1, 之 间 的 无 关 指令 条 数 不 用 前 递 时 的 气泡 个 数 用 前 递 时 的 气泡 个 数 
EF i 
ron ee 


其 他 数据 冒险 的 类 型 ”其 他 两 种 冒险 类 型 ， 即 写 后 读 和 写 后 写 冒 险 ， 对 流水 线 处 理 硕 会 
造成 各 自 特 有 的 问题 。 但 是 ， 这 些 问 题 在 影响 流水 线 处 理 需 的 性 能 方面 远 不 及 与 后 谈 的 问题 
严重 。 壁 如 说 ， 读 后 写 全 然 不 是 问题 ， 因 为 需要 读数 据 的 指令 已 经 在 ID/RR 阶段 就 把 寄存 天 
的 值 存 到 流水 线 缓冲 器 里 了 。 对 于 写 后 写 冒险 ,一 个 简单 的 解决 方案 是 ， 如 果 一 条 指令 将 要 
把 值 写 入 寄存器， 而 它 在 ID/RR 阶段 时 看 到 该 寄存 器 的 忙 位 为 1 时 就 拖延 它 ， 直 到 把 寄存 器 
的 忙 位 设置 为 1 的 指令 在 WB 阶段 把 它 清 零 为 止 。 

让 我 们 来 理解 以 下 写 后 写 冒 险 的 根源 。 写 后 写意 味 着 一 条 指令 要 写 入 的 寄存 副将 要 被 随 
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Jai — Ata it, 并且 两 个 指令 之 间 并 没有 读 取 该 寄存 器 的 指令 。 我 们 可 以 安全 地 推论 ， 
前 一 次 写 人 完全 没有 有用。 毕竟 ， 如 果 在 前 一 次 写 之 后 要 有 一 次 读 取 ， 那 么 就 是 写 后 读 冒 险 ， 
而 不 是 写 后 写 冒 险 了 。 这 就 提出 了 问题 ， 为 什么 编译 器 要 产生 具有 写 后 写 冒 险 的 代码 呢 ? 对 
于 这 个 问题 ， 有 几 种 可 能 的 答案 。 在 之 前 ,我 们 提 及 过 导致 流水 线 冒 险 的 程序 属性 。 流 依赖 
是 程序 本 身 回 有 的 属性 ， 而 反 依 赖 和 输出 依赖 主要 是 由 编译 器 激进 地 使 用 寄存 器 存储 程序 变 
量 而 引入 的 。 回 忆 一 下 ， 寄 存 需 访问 比 内 存 访 问 快 很 多 ， 外 加 寄存 器 的 数量 很 有 限 。 因 此 ， 
编译 一 可 能 会 重用 寄存 融 去 存储 不 同 的 程序 变量 ,引入 反 依赖 和 输出 依赖 ， 从 而 导致 流水 线 
处 理事 里 的 写 后 读 和 写 后 写 冒 险 。 我 们 将 在 第 5.15.4 节 中 更 加 详细 讨论 这 个 问题 ， 并 且 给 出 
这 个 问题 的 可 能 的 硬件 解决 方案 。 


9.13.3 控制 冒险 


这 种 冒险 是 指 程序 由 于 分 支 语 句 而 打破 了 顺序 执行 。 在 基准 测试 程序 中 关于 动态 指令 频 
率 的 研究 表明 , 每 4 ~ 6 条 指令 中 就 有 一 条 是 条 件 分 支 指令 。 分 支 导致 正常 的 控制 流 中 断 ， 
因而 对 流水 线 处 理 带 的 性 能 有 害 。 这 个 问题 对 于 条 件 分 支 指令 尤其 严重 ， 因 为 分 支 的 结果 通 
党 下 到 流水 线 的 很 运 的 地 方才 能 被 发 现 。 

假设 按照 程序 顺序 进入 流水 线 的 指令 流 如 下 


BEQ 
ADD 
NAND 
LW 


一 个 保守 的 处 理 分 支 的 方法 是 在 解码 阶段 发 现 分 支 指令 时 就 防止 新 指令 进入 流水 线 ， 直 
到 分 支 被 确定 了 ， 正 常 的 执行 再 继续 ， 可 能 是 按 顺序 执行 下 去 ， 也 可 能 从 跳 转 目标 开始 执行 。 
图 5-13 展示 了 这 样 一 个 保守 的 做 法 下 的 指令 流 。 对 于 BEQ 指令 ， 我们 在 EX 阶段 结束 时 知 
道 它 的 结果 。 如 果 分 支 未 被 采取 (也 就 是 继续 接着 顺序 执行 )， 那么 IF 阶段 已 经 有 了 从 内 存 中 
读 取 的 正确 的 指令 ， 可 以 传递 给 ID/RR 阶段 。 因 此 ， 我 们 将 流水 线 拖 延 一 个 周期 ， 然 后 再 继 
续 执行 图 5-13 中 的 ADD 指令 。 但 是 ， 如 果 分 支 被 采取 ， 那 么 我 们 就 不 得 不 再 从 BEQ 指令 在 
EX 阶段 结束 以 后 计算 得 到 的 PC 地 址 开始 取 指 令 。 因 此 ， 在 第 4 个 周期 ， 我们 开始 读 取 分 支 
目标 处 的 正确 的 下 一 条 指令 。 因 此 ， 如 果 分 支 被 采取 的 话 ， 根 据 前 面 的 方案 ， 就 会 有 两 个 时 
钟 周期 的 延 时 。 


* 我 们 在 取 指 令 阶 段 实 际 上 并 不 知道 这 条 指令 是 什么 

+ ADD 指令 在 IF 阶段 被 拖延 直到 BEQ 指令 解决 - 之 前 的 方案 假设 
分 支 会 不 成 功 ， 而 读 取 下 一 条 指令 ， 让 它 在 BEQ 解决 之 后 立 
刻 进入 IF 阶段 。 如 果 分 支 成 功 的 话 ， 将 会 用 更 多 一 个 时 钟 周 
期 的 延 时 来 访问 跳 转 到 的 指令 。 





图 5-13 ”一 种 处 理 分 支 语 句 的 保守 方案 


6S 


考虑 以 下 指令 序列 : 


BEQ LI 
ADD 
LW 


L1 NAND 
SW 
硬件 采用 保守 策略 来 处 理 分 支 。 
a. 假设 分 支 未 被 采取 ， 填 下 表 以 给 出 指令 通过 流水 线 的 执行 过 程 ， 直 到 3 条 指令 成 功 地 从 流水 
线 引 退 。 这 3 条 指令 的 实测 CPI 是 多 少 ? 
b. 假设 分 支 被 采取 ， 填 下 表 以 给 出 指令 通过 流水 线 的 执行 过 程 ， 直 到 3 条 指令 成 功 地 从 流水 线 
这 3 条 指令 的 实测 CPI 是 多 少 ? 


N’ 
© 
-— 


引退 。 
答 : 

a 在 分 支 未 被 采取 时 ， 给 定 的 执行 序列 的 时 间 表 如 下 。 注 意 ADD 指令 在 正 阶段 被 拖延 了 一 个 
周期 ， 然 后 BEQ 指令 在 EX 阶段 结束 时 被 解决 了 ，ADD 指令 就 可 以 继续 向 下 传递 了 。 


周期 
编导 





aon DD a fk oO N = 


这 三 条 指令 的 平均 CPI 是 8/3 = 2.666. 

b. 在 分 支 被 采取 时 ， 给 定 的 执行 序列 的 时 间 表 如 下 。 注 意 IF 阶段 读 取 的 ADD 指令 在 第 4 个 时 
钟 周期 必须 被 转化 为 一 个 NOP， 因 为 分 支 被 采取 了 。 在 第 4 个 时 钟 周期 开始 要 从 分 支 的 目标 读 取 一 
条 新 的 指令 ， 因 此 流水 线 被 拖延 了 两 个 时 钟 周期 。 


周期 | > 








1 = 

2 = xs = 

3 BEQ = = 

4 NOP BEQ a 

5 SW NAND | NOP NOP BEQ 
6 一 SW NAND | NOP NOP 
7 一 = SW NAND | NOP 
8 一 SW NAND 
9 一 SW 


202 这 三 条 指令 的 平均 CPI 是 9/3=3。 
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当然 了 ， 如 果 愿 意 为 这 个 问题 添加 更 多 的 硬件 ， 我 们 可 以 做 得 更 好 一 些 。 实 际 上 ， 解 决 
这 个 由 流水 线 中 的 分 支 语句 导致 的 厂 烦 有 好 几 种 方法 。 这 是 计算 机 体系 结构 社区 里 的 热门 研 
究 领 域 。 尤 其 是 现代 处 理 右 可 能 采用 深度 流水 线 (有 超过 20 个 阶段 )， 能 够 高 速 处 理 分 支 对 于 
确保 高 性 能 来 说 极端 重要 。 

在 本 章 中 ,我 们 将 会 介绍 解决 该 问题 的 诸多 方案 中 的 一 部 分 。 要 想 了 解 更 多 这 方面 的 内 
容 ， 你 需要 再 修一 门 体系 结构 方面 的 高 级 课程 。 

处 理 流水 线 处 理 器 中 的 分 支 ”延迟 分 支 和 分 支 预测 是 解决 流水 线 中 此 问题 的 两 种 方式 。 

1) 延迟 分 支 ” 这 里 的 想法 是 假设 分 文 指 令 之 后 的 指令 不 管 分 支 的 结果 ,一定 会 被 执行 。 
这 样 就 简化 了 人 硬件 ， 因 为 就 没有 必要 取消 分 文 之 后 的 指令 。 确 保 程 序 语义 正确 的 责任 就 从 硬 
件 转移 给 了 编译 融 。 上 默认 的 方法 是 在 软件 ( 即 程 序 在 内 存 中 的 映像 ) 中 的 每 个 分 文 语句 之 后 加 
上 一 个 NOP。 你 也 许 会 问 这 样 的 方法 有 什么 用 。 答 案 是 ， 聪 明 的 编译 需 会 对 程序 进行 分 析 ， 
找到 一 条 有 用 而 且 放 在 分 文 语 句 之 后 不 会 影响 语义 的 指令 ， 以 取代 NOP 指令 。 紧 跟着 分 支 指 
令 的 指令 槽 被 称 作 延迟 模 。 相 应 地 ， 这 个 技术 被 称 作 延 迟 分 支 。 

图 5-14 和 图 5-15 中 的 代码 片段 说 明了 一 个 编译 瞬 可 以 找到 有 用 的 指令 塞 进 延迟 权 里 。 在 
这 个 例子 里 ， 对 于 每 个 分 支 语句 ， 无 论 分 支 的 结果 是 什么 都 会 执行 紧 跟着 分 支 语句 的 指令 。 
如 果 分 支 不 成 功 ， 流 水 线 就 不 用 延 时 继续 执行 。 如 果 分 文成 功 了 ,那么 (和 分 文 预测 失败 情 
况 一 样 ) 分 支 之 后 的 除了 第 一 条 以 外 的 指令 就 得 被 终止 把 。 


在 代码 优化 把 分 支 延 总 槽 给 填 上 之 前 的 代码 
给 一 个 地 址 为 a0 的 10 个 元 素 的 数组 的 每 个 元 素 加 7 


tl, a0, 40 ; 当 a0=t1 时 程序 结束 
beq a0, tl, done 
nop ; DRIER 
lw t0, 0(a0) 
addi t0, t0, 7 
SW t0, 0(a0) 
addi a0, a0, 4 
beq zero, zero, loop 
nop ; HERS 
: halt 





图 5-14 ”延迟 分 支 ， 延迟 槽 里 装着 NOP 


在 代码 优化 把 分 支 延迟 槽 给 填 上 之 后 的 代码 

给 一 个 地 址 为 a0 的 10 个 元 素 的 数组 的 每 个 元 素 加 7 

tl, a0, 40 ; 当 a0=t1 时 程序 结束 
: beq , tl, done 

lw , 0(a0) ; FER 

addi » tO 7 

Sw , 0(a0) 


beq zero, zero, loop 


addi a0, a0, 4 ; FER 
: halt 





图 5-15 ”延迟 分 支 : 把 延迟 槽 里 的 NOP 换 成 有 用 指令 


ee -可 9 


参考 图 $S-14， 编 译 需 知道 标注 [1] 和 [4] 的 指令 永远 会 被 执行 ， 因 此 ， 编 译 器 一 开始 
把 NOP 作为 占 位 符 放 在 这 些 槽 里 。 在 优化 阶段 中 ， 编 译 器 发 现 指 令 [2] 从 程序 语义 来 说 
是 良性 9 的 ， 因 为 它 只 是 把 一 个 值 加 载 进 一 个 临时 寄存 器 。 因 此 ， 编 译 器 把 NOP 指令 [1] # 
换 成 图 5-15 中 的 读 取 内 存 的 指令 [2]。 类 似 地 ,循环 里 的 最 后 一 条 分 支 语句 是 个 无 条 件 分 
支 语句 ， 不 依赖 于 之 前 的 ADD 指令 [3]。 因 此 ， 在 图 5-15 中 编译 器 把 NOP 指令 [4] 换 成 
ADD 指令 [3]。 

有 些 机 器 甚至 会 使 用 多 个 延迟 槽 以 在 分 支 代价 很 高 时 提升 流水 线 效 率 。 延 迟 槽 的 数量 越 
多 ， 在 成 功 分 支 时 需要 终止 的 指令 条 数 越 少 。 但 是 ， 这 也 增加 了 编译 器 寻找 捅 人 延迟 槽 的 有 
用 指令 的 负担 ， 而 且 有 时 候 根 本 就 找 不 到 这 样 的 指令 。 

延迟 分 支 似乎 是 个 合理 的 想法 ,尤其 是 流水 线 不 深 (小 于 10 个 阶段 ) 时 ， 因 为 它 把 硬件 
简化 了 。 但 是 ， 这 个 想法 有 几 个 问题 。 最 明显 的 问题 是 它 把 微 体系 结构 的 细节 暴露 给 了 编译 
器 作者 ， 也 就 让 编译 器 不 仅仅 要 针对 指令 集 ， 还 要 针对 特定 处 理 器 实现 。 要 不 然 ， 对 于 每 一 
代 处 理 器 都 得 重 写 编译 需 的 一 部 分 ， 否 则 就 得 为 了 回 后 兼容 而 对 微 体系 结构 的 变革 加 以 限制 。 
而 且 ， 现 代 的 处 理 融 采用 放流 水 线 。 例 如 ， 最 近 的 Intel Pentium 处 理 右 有 超过 20 个 流水 线 阶 
段 。 流 水 线 变 得 更 深 ， 但 是 决定 了 程序 中 分 支 指令 出 现 频 率 的 基本 块 大 小 并 没有 发 生变 化 。 
甚至 ， 由 于 面 对 对 象 的 编程 ， 分 支 语 句 变 得 更 加 频繁 了 。 因 此 ， 延 迟 分 支 在 现代 处 理 器 实现 
中 不 受 欢 迎 。 

2 ) 分 支 预测 ”这 里 的 想法 是 假设 分 文 的 结果 是 某 个 方向 ， 即 使 有 分 支 指令 也 继续 让 指令 
进入 流水 线 。 例 如 ， 对 于 图 5-13 中 的 相同 序列 ， 让 我 们 预测 结果 是 不 跳 转 ( 即 顺序 执行 路 径 
是 赢家 )。 图 5-16 展示 出 采用 这 个 预测 情况 下 流水 线 中 的 指令 流 。 在 分 支 的 结果 被 知道 以 后 
(BEQ 在 EX 阶段 中 )， 结 果 被 传递 回 之 前 的 阶段 里 。 图 5-16 展示 出 结果 符合 预测 时 的 美好 情 
形 ， 流 水 线 完 全 没有 延迟 就 继续 执行 了 。 


* 我 们 在 取 指 令 阶 段 实际 上 并 不 知道 这 条 指令 是 什么 





图 5-16 “分 支 预测 


当然 了 ， 也 有 可 能 预测 错误 ， 我 们 得 从 这 样 的 错误 预测 中 恢复 。 因 此 ， 我 们 需要 一 种 硬 
件 机 制 来 终止 流水 线 中 之 前 的 阶段 里 执行 了 一 部 分 的 指令 ， 而 改 从 另 一 个 分 文 开始 读 取 指令 。 
这 种 终止 能 力 经 常 被 称 作 冲刷 。 我 们 用 一 条 额外 的 称 作 “冲刷 ”的 反馈 线路 来 实现 这 个 硬件 
机 制 ， 如 图 5-17 所 示 。 在 收 到 冲刷 信号 之 后 ，IF 和 ID/RR 阶段 放弃 正在 处 理 的 部 分 执行 的 指 
今 ， 向 流水 线 中 塞 入 气泡 。 在 正常 执行 开始 前 会 插入 两 个 气泡 ， 即 两 个 时 钟 周 期 的 延 返 ， 对 
应 于 图 5-17 中 的 ADD 和 NAND 指令 。 


日 ”这 里 是 为 了 展示 延迟 分 支 的 概念 。 严 格 来 说 ， 在 循环 结束 以 后 执行 读 取 内 存 指令 有 可 能 会 访问 到 一 个 已 经 
不 存在 的 内 存 地 址 。 
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冲刷 
图 5-17 带 着 冲刷 控制 线路 的 流水 线 205 


考虑 以 下 指令 序列 : 


BEQ Ll 
ADD 
LW 


L1 NAND 
SW 

硬件 使 用 了 分 支 预测 (预测 分 支 不 会 被 采取 )。 

a. 假设 预测 正确 ， 填 下 表 展 现 指令 流 过 流水 线 的 过 程 ， 直 到 3 条 指令 成 功 引退 为 止 。 这 3 条 指 
令 的 实测 CPI 是 多 少 ? 

a. 假设 预测 错误 ， 填 下 表 展 现 指 令 流 过 流水 线 的 过 程 ， 直 到 3 条 指令 成 功 引退 为 止 。 这 3 条 指 
令 的 实测 CPI 是 多 少 ? 
答 : 

a 在 预测 正确 的 情况 下 ， 给 定 序列 的 分 时 图 表 如 下 。 分 治 预测 逻辑 把 顺序 执行 的 指令 喂 进 流水 
线 ， 而 且 它 们 都 成 功 执行 完 : 


周期 
ac 


N Oo oO S WD ND 





第 7 周期 结束 时 ， ， 因 此 平均 CPI EZ 7/3=2.333. 

b. 在 预测 错误 的 情况 下 ， 给 定 序列 的 分 时 图 表 如 下 。 注意 ，ADD 和 LW 指令 在 BEQ 确定 分 支 
的 结 ; 果 被 错误 预测 时 就 被 从 各 自 所 在 的 阶段 给 冲刷 指 了 。 这 就 是 为 什么 在 第 4 个 周期 里 ADD 和 LW 
被 蔡 换 成 了 NOP 指令 。PC 在 BEQ 指令 的 EX 周期 (第 3 个 周期 ) 结束 时 被 设置 成 跳 转 地 址 ， 以 便 
第 4 个 时 钟 周 期 时 可 以 开始 读 取 正确 的 指令 。 

平均 CPI 是 9/3= 3。 

注意 平均 CPI 和 我 们 之 前 不 用 分 支 预测 且 分 支 被 采取 时 的 平均 CPI 相同 。 
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周期 
编号 MEM | WB 
1 = 
2 E 7 
3 a £ 
4 BEQ |- 
5 NOP | BEQ 
6 NOP | NOP 
7 村 - SW NAND | NOP 
8 - SW NAND 
9 - SW 


你 也 许 会 好 奇 ， 看 起 来 分 支 被 采取 和 不 被 采取 的 概率 差不多 ， 我 们 怎么 能 预测 分 支 的 结 
果 呢 ”事实 上 ,程序 具有 很 多 能 帮助 预测 的 结构 。 比 如 说 ， 一 个 循环 通常 来 说 循环 结束 时 会 
有 一 个 条 件 分 支 语 句 来 控制 是 返回 循环 的 开头 还 是 跳出 循环 。 我 们 能 立即 看 出 ， 这 个 条 件 分 
文 的 结果 严重 偶 回 于 跳 回 循环 开头 。 因 此 ， 分 文 预测 技术 就 依赖 于 这 种 程序 的 结构 属性 。 

人 们 投入 了 相当 多 的 精力 来 研究 程序 中 分 支 的 属性 ， 并 设计 支持 它们 的 预测 方案 。 我 
们 先前 已 经 提 到 ， 循 环 和 条 件 语 句 是 产生 分 文 语 句 的 高 阶 结构 。 一 种 分 支 预测 的 手段 是 如 
果 目 标 地 址 小 于 当前 PC 值 ， 就 预测 分 支 会 被 采取 。 反 过 来 ,如果 目 标 地 址 大 于 当前 PC 
值 ， 就 预测 分 支 不 会 被 采取 。 这 个 策略 背后 的 理由 是 循环 一 般 来 说 都 用 到 一 个 癌 后 的 分 支 
语句 以 返回 循环 的 头 部 (也 就 是 回 到 一 个 较 低 的 地 址 )， 而 且 这 种 事情 发 生 的 概率 更 高 ， 因 
为 循环 会 被 多 次 执行 。 男 一 方面 ， 癌 前 的 跳 转 通 第 对 应 着 条 件 语 句 ， 它 们 相对 而 言 较 少 被 
AM 

ay CFR Ah HE Ba FE a A AR AA, EE AR or Br A EE TT. ISA 必须 提供 一 种 让 编 
PE aE PH TAK 2 EAE ASL th RK SEAS TAL, RAR RB EE 2 BP A Fe SB YP 
文 指令 提供 两 个 不 同 的 版 本 ， 区 别 就 在 于 是 预测 分 文 是 被 采取 还 是 不 被 采取 。 编 译 需 会 针对 
给 定 的 分 支 指令 选择 最 适合 它 的 需求 的 版 本 。 

3) 带 分 支 目 标 缓存 的 分 支 预测 ”这 个 方法 基于 之 前 我 们 提 到 的 分 支 预测 。 它 使 用 一 个 被 
称 作 分 支 目 标 缓存 (BTB, Branch Target Buffer) 9 的 人 硬件 装置 来 改进 分 支 预 测 。BTB 本 质 上 
就 是 一 张 表 ， 其 中 每 一 项 包含 三 个 字段 ， 如 图 5-18 所 示 。 


分 支 指令 地 址 选取 /未 选取 分 支 指令 目标 地 址 


图 $-18 BTB 中 的 一 项 


BTB 把 特定 程序 执行 过 程 中 遇 到 的 分 支 语句 的 历史 记录 下 来 -BTB 可 能 项 的 个 数 不 多 (fil 
如 ，100 条 )。 每 次 遇 到 一 条 分 支 指 令 ， 硬 件 就 会 查找 BTB。 我 们 假设 分 支 指令 的 PC 值 并 不 
在 BTB 中 (因为 是 第 一 次 遇 到 )。 这 种 情况 下 ， 在 分 支 的 结果 被 确定 以 后 ， 就 会 在 BTB 中 创 
建 一 个 新 项 ， 包 含 该 分 支 指令 的 地 址 、 分 支 的 目标 地 址 以 及 分 支 的 方向 《被 采取 还 是 不 被 采 


O ”我 们 已 经 在 5.11 节 里 介绍 了 缓存 的 概念 。 第 9 章 包含 对 缓存 的 详细 讨论 。BTB 本 质 上 就 是 把 分 支 目标 地 址 
与 分 支 指 堆 地 址 相 匹配 的 缓存 。 用 来 实现 BTB 的 硬件 类 似 于 缓存 的 硬件 。 


AL FE Fs HERE A ie PREC AL EL Bag 1 tf 14] 


取 )。 下 次 遇 到 同一 条 分 支 指令 的 时 候 ， 这 份 历史 信息 就 能 帮忙 预测 分 支 结 果 了 。IF 阶段 会 检 
但 BTB， 如 条 查找 成 功 ( 即 BTB 中 包含 正在 读 取 的 分 支 指令 的 地 址 项 ， 并 且 把 对 应 的 跳 转 地 
址 发 给 了 流水 线 )， 那 么 IF 阶段 就 立刻 从 分 支 目标 地 址 开始 取 指 令 。 这 种 情况 下 ， 分 支 指令 在 
流水 线 中 不 会 引起 任何 气泡 。 当 然 ， 预 测 可 能 会 失败 。 通 常 来 说 预测 失败 是 因为 在 执行 一 个 
循环 的 第 一 次 或 者 最 后 一 次 迭代 的 分 支 语句 。 数 据 通 路 里 的 冲刷 线路 负责 处 理 这 种 预测 错误 。 
我 们 可 以 通过 提供 多 于 一 位 的 历史 来 使 历史 机 制 更 加 健壮 。 

流水 线 处 理 器 中 处 理 分 支 的 方式 的 总 结 ” 指令 集 的 实现 细节 通常 被 称 作 处 理 器 的 微 体系 结 
构 。 在 微 体系 结构 里 处 理 分 文 是 获取 高 性 能 的 关键 ， 尤 其 是 在 现代 处 理 器 的 流水 线 越 来 越 深 的 
情况 下 。 我 们 已 经 提 到 过 ， 编 译 出 的 代码 中 的 分 支 频 率 可 以 高 到 每 三 四 条 指令 中 就 有 一 条 。 因 
此 ， 流水线 有 20 个 阶段 的 时 候 ， 流 水 线 不 同 阶段 中 的 部 分 执行 了 的 指令 很 少 可 能 是 顺序 指令 。 
因此 ， 对 于 分 支 语 句 的 可 能 结果 早 做 决定 ,使 得 流水 线 能 塞 满 有 用 的 指令 ， 是 在 深 流水 线 处 理 
侣 上 取得 良好 性 能 的 关键 。 我 们 将 在 5.15 节 中 讨论 流水 线 处 理 器 设计 的 现状 。 表 5-5 总 结 了 我 
们 在 本 章 讨论 过 的 各 种 用 于 处 理 分 支 的 技术 ， 以 及 使 用 了 这 些 技 术 的 处 理 器 。 


表 5-5 ”处理 分 支 的 技术 总 结 





名 称 实际 应 用 
拖延 流水 线 | 策略 简单 ， 不 需要 冲刷 | 性 能 损失 早期 的 流水 线 机 器 ， 如 IBM 360 
指令 的 硬件 系列 
分 支 预 测 (分 支 | ”只 需 少量 额外 硬件 ， 因 | ”需要 在 流水 线 中 溃 刷 指令 ”| 绝 大 多 数 现代 处 理 器 ， 如 mtel 


未 被 采取 ) 为 按 顺 序 执行 所 需 取 的 指 Pentium, AMD Athlon 和 PowerPC 

令 已 经 在 正 阶段 中 都 使 用 这 个 技术 。 通 常 它们 也 使 用 
复杂 的 分 支 目 标 缓存 。MIPS R4000 
采用 一 个 延迟 权 加 上 两 个 周期 的 分 
支 不 采取 预测 的 混合 策略 





因为 跳 转 的 目标 也 就 是 PC 
的 新 值 要 一 直 等 到 分 支 指令 在 
EX 阶段 才 知 道 ， 这 个 技术 需 
要 更 精巧 的 硬件 支持 才能 投入 
实际 应 用 
在 现代 处 理 器 增加 流水 线 深 
BE LIJA Sea PE ti H HE HS A E 
加 困难 了 ; 由 于 向 后 兼容 性 而 
限制 了 微 体 系 结构 的 演化 ; 
让 编译 器 不 但 要 针对 目标 体系 
结构 ， 还 得 针对 特定 硬件 实现 






性 能 好 ， 但 是 需要 更 加 
精巧 的 硬件 设计 


分 支 预 测 (AP XL 
被 采取 ) 























较 旧 的 RISC 体 系 结 构 ， 如 
MIPS., PA-RISC 和 SPARC 


不 需要 任何 额外 硬件 来 
拖延 或 者 冲刷 指令 ; 通过 
把 流水 线 延 迟 槽 骏 露 给 编 
译 天 来 获取 高 性 能 


HEIR Tt XL 







5.13.4 冒险 总 结 


我 们 已 经 讨论 了 结构 、 数 据 和 控制 冒险 ， 以 及 在 微 体系 结构 内 解决 它们 的 最 基本 的 机 制 。 
我 们 主要 介绍 了 检测 和 解决 这 些 冒 险 的 硬件 方式 。 当 冒险 被 硬件 检测 和 处 理 的 时 候 ， 它 们 经 
常 被 称 作 硬 件 互 锁 。 但 是 ， 这 份 责任 也 完全 可 以 由 硬件 转移 给 软件 ， 即 编译 占 。 办 法 就 是 把 
微 体系 结构 的 细节 暴露 给 编译 器 ， 让 编译 器 作者 可 以 确保 (a) 这 些 冒险 在 程序 优化 的 时 候 就 
被 消除 了 ,或 者 (b) 通过 显 式 插入 NOP 指令 来 克服 冒险 。 例 如 ， 对 于 我 们 一 直 在 讨论 的 五 
阶段 流水 线 ， 如 果 编 译 器 总 是 确保 被 写 人 的 寄存 器 在 紧 跟 的 至 少 三 条 指令 中 没有 被 用 到 的 话 ， 
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就 不 会 有 写 后 读 冒 险 。 或 者 可 以 通过 把 其 他 有 用 的 指令 放 在 定义 一 个 值 和 随后 使 用 这 个 值 的 
语句 之 间 ， 也 可 以 在 找 不 到 这 种 有 用 指令 的 时 候 把 显 式 的 NOP 指令 插 进 去 。 
把 编译 带 的 负担 转移 到 编译 融融 来 的 好 处 是 硬件 就 被 简化 了 ， 因 为 既 不 需要 检测 冒险 ， 
也 不 需要 采用 类 似 数 据 前 递 的 技术 。 早 期 版 本 的 MIPS 体系 结构 就 没有 硬件 互 锁 ， 完 全 依靠 
编译 天 来 解决 这 种 冒险 。 但是， 问题 是 编译 时 并 不 一 定 能 了 解 这 种 依赖 ， 比 如 说 一 个 加 载 指 
令 也 许 需 要 超过 两 个 时 钟 周 期 才能 取得 数据 ， 这 取决 于 内 存 系统 的 状态 。 随 着 流水 线 变 得 更 
深 ， 问 题 也 愈加 严重 。 因 此 ， 所 有 的 现代 处 理 咒 都 采用 硬件 互 锁 来 消除 冒险 。 为 了 让 硬件 和 
软件 合作 ， 芯 片 生产 商 把 微 体 系 结构 的 细节 公开 出 来 ， 以 帮助 编译 器 作者 利用 这 些 细节 来 编 
写 高 效 的 编译 带 。 有 些微 体系 结构 做 得 更 进一步 。VLIW (Very Large Instruction Word， 超 长 
指令 字 ) 微 体系 结构 被 设计 成 与 编译 器 互相 合作 ， 因 此 两 者 对 于 决定 处 理 需 的 性 能 来 说 同等 
PH, 
K 5-6 总 结 了 可 能 导致 流水 线 拖延 的 LC-2200 指令 ， 以 及 这 样 的 拖延 能 被 便 件 方案 解决 
到 什么 程度 。 
表 5-6 LC-2200 中 冒险 的 总 结 
指令 冒险 类 型 ”| 可 能 拖延 的 周期 数 加 分 支 预测 (预测 分 支 未 被 采取 ) 
= a 
BEQ 0 (成 功 ) 或 2 (预测 失败 ) 


5.14 在 流水 线 处 理 器 里 处 理 程 序 不 连续 性 


在 之 前 讨论 中 断 时 提 到 过 ， 我 们 得 等 到 有 限 状态 机 处 在 一 个 可 以 进入 中 断 的 干净 状态 。 
对 于 非 流水 线 处 理 器 ， 执 行 完 一 条 指令 时 就 是 这 样 的 状态 。 在 流水 线 寄存 器 里 ， 由 于 任何 时 
间 点 都 有 多 条 指令 在 执行 途中 ( 即 处 于 部 分 执行 状态 )， 难 以 定义 这 样 的 干净 状态 是 什么 。 这 
就 使 得 中 断 以 及 异常 和 陷入 等 其 他 导致 程序 不 连续 性 的 东西 处 理 起 来 很 复杂 。 

处 理 中 断 有 两 种 可 能 的 办 法 。 一 种 是 外 部 中 断 一 到 达 ， 处 理 器 就 

1 ) 停止 继续 回流 水 线 发 送 指令 〈 即 IF 阶段 的 逻辑 来 开始 产生 NOP 指令 回 后 传递 ); 

2 ) 一 直 等 到 已 经 在 流水 线 里 的 指令 运行 完 (也 就 是 把 流水 线 排 空 ); 


3) 进入 中 断 状态 ， 类 似 于 我 们 在 第 4 章 讨论 的 情形 ， 然 后 做 中 断 规 定 该 做 的 事情 (参见 
例 5-17 )。 


把 流水 线 排 空 的 坏处 就 是 外 部 中 断 的 啊 应 时 间 可 能 很 慢 ， 尤 其 是 现代 处 理 融 流水 线 很 深 
的 时 候 更 是 如 此 。 另 一 种 选择 是 冲刷 流水 线 。 中 断 到 来 的 时 候 发 送 一 个 信号 给 各 个 阶段 ， 主 
丢弃 它们 各 自在 处 理 的 指令 。 这 使 得 处 理 硕 可 以 立刻 处 理 中 断 。 当 然 了 ， 这 种 情况 下 ， 最 后 
完成 的 指令 的 地 址 就 得 存在 PC 里 ， 因 为 它 是 程序 在 处 理 完 中 断 以 后 继续 执行 的 起 点 。 实 现 
这 样 的 方案 有 一 些微 妙 的 小 地 方 得 注意 : 要 确保 在 流水 线 的 任何 阶段 里 ， 部 分 执行 的 指令 不 
会 修改 任何 永久 的 程序 状态 〈 即 寄存 需 值 )。 

现实 中 ， 处 理 器 不 会 采用 以 上 两 种 极端 情况 。 中 断 会 被 流水 线 的 特定 阶段 捕获 ， 程 序 执 
行 就 会 从 这 个 阶段 的 指令 那里 开始 。 这 个 阶段 之 后 的 指令 就 继续 执行 到 完成 ， 而 这 个 阶段 之 
前 的 指令 就 被 冲刷 掉 了 。 在 任何 一 种 情况 下 ， 都 有 一 个 有 趣 的 问题 :“ 在 流水 线 处 理 硕 里 用 俐 
件 支 持 中 断 意味 着 会 发 生 什 么 ? ”流水 线 寄 存 顺 是 处 理 需 内 部 状态 的 一 部 分 。 之 前 提 到 的 几 个 
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方法 都 会 让 处 理 器 进入 干净 的 状态 ， 所 以 我 们 只 需要 关心 把 PC 这 个 值 记 下 来 以 在 中 断 以 后 
能 正确 恢复 执行 即 可 。 需 要 保存 的 PC 的 值 当然 取决 于 选择 的 方法 。 
如 果 我 们 决定 简单 化 处 理 ， 在 进入 INT KRS (人 参见 第 4 章 ) 前 排 空 流水 线 ， 那 么 只 要 
把 IF 阶段 里 指向 程序 下 一 条 指令 的 PC 值 冻 结 起 来 就 够 了 。 在 中 断 的 时 候 ， 硬 件 会 把 这 个 PC 
告诉 INT 宏 状 态 以 便 保存 。 


列举 一 个 流水 线 处 理 器 的 硬件 从 中 断 开始 到 处 理 器 开始 执行 中 断 处 理 代码 的 过 程 中 采取 的 步 
又 。 假 设 流水 线 遇 到 中 断 的 时 候 会 排 空 (只 要 描述 出 来 就 行 了 )。 
> 


1) 允许 流水 线 中 现存 的 指令 (有 用 的 指令 ) 完成 执行 

2) 停止 取 新 的 指令 。 

3) 开始 从 取 指 令 阶 段 向 流水 线 中 发 送 NOP 指令 。 

4) 在 所 有 指令 都 执行 完毕 之 后 ,记录 程序 回复 执行 所 需 的 PC。( 这 个 值 就 是 最 后 一 条 完成 的 有 
用 指令 的 内 存 地 址 加 1.) 

5 ) 后 面 3 步 是 我 们 在 第 4 章 讨 论 过 的 中 断 状态 行动 

6) 进入 INT 状态 ,发 送 INTA 信号， 接收 向 量 ， 禁 止 中 断 。 

7) 把 当前 模式 存 进 系统 栈 里 ， 把 模式 切换 到 内 核 模式 

8) 把 PC 存 进 $Sk0， 从 中 断 向 量 里 获得 中 断 处 理 代码 地 址 ; 载 入 PC; 继续 流水 线 执行 


冲刷 流水 线 (不 管 是 完全 冲刷 还 是 部 分 冲刷 ) 需要 让 流水 线 寄存 胡 带 着 每 个 指令 的 PC 
值 ， 因 为 我 们 不 知道 什么 时 候 会 发 生 外 部 中 断 。2 实 际 上 ， 在 流水 线 处 理 器 里 每 条 指令 都 必须 
把 PC 值 带 着 ， 因 为 任何 指令 都 可 能 导致 异常 / 陷入。 我 们 需要 知道 导致 陷入 的 指令 ， 才 能 处 
理 完 陷入 /异常 以 后 恢复 执行 。 遇 到 中 断 以 后 ， 硬 件 会 把 第 一 个 未 完成 的 指令 〈 即 程序 继续 执 
行 时 开始 的 指令 ) 的 PC 值 告 知 INT 宏 状态 以 便 保 存 。 例 如 ， 如 果 中 断 被 流水 线 的 EX 阶段 捕 
ak, BSA MEM 和 WB 阶段 的 当前 指令 被 允许 执行 完 ， 而 对 应 于 流水 线 里 EX 阶段 的 指令 的 
PC 值 就 是 程序 继续 执行 的 位 置 。 
eR 一 个 LC-2200 的 流水 线 实现 允许 中 断 在 五 阶段 流水 线 的 EX 阶段 里 被 捕获 ， 将 流水 线 前 面 的 
指令 排 空 ， 并 冲刷 掉 之 后 的 指令 。 假 设 解决 写 后 读 冒 险 采 用 了 寄存 器 前 说 。 考 虑 以 下 程序 : 


100 LW R1, MEM[2000]; /* 假设 MEM[2000] 的 值 是 2 */ 


ad 


101 LW R2, MEM[2002]; /* 假设 MEM[2002] 的 值 是 5 */ 
102 NOP ; /* 给 LW R2 配 了 一 个 NOP x / 
103 ADD R3, Rl, R2; /* 加 法 R3 + R14+R2 */ 

104 SW R3, MEM[2004]; /* 把 R3 存 入 MEM[2004] */ 


105 LW Rl, MEM[2006]; /* 假设 MEM[2006] 里 的 值 是 3 */ 


NOP (地 址 是 102 ) 在 流水 线 的 MEM 阶段 时 发 生 了 中 断 。 回 答 下 列 问题 : 

a. R1, R2, R3, MEM[2000], MEM[2002], MEM[2004] 和 MEM[2006] 里 的 值 在 进入 INT 状态 
时 分 别 是 多 少 ? 

b. 传递 给 INT 状态 的 PC 值 是 多 少 ? 


日 ”回忆 一 下 ,在 早先 关于 流水 线 寄存 器 的 讨论 中 ,我们 提 到 过 只 有 BEQ 指令 的 执行 需要 带 着 PC 的 值 。 
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”此 处 作者 误 写 为 ADD 指令 
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答 : 当中 断 发 生 时 ， 处理 器 状态 如 下 : 





因此 ， 在 EX 阶段 前 面 的 阶段 ( 即 MEM 和 RW) 将 会 执行 完 ， 而 ID/RR 和 IF 阶段 里 的 指令 会 久 
冲刷 掉 。 程 序 将 会 在 地 址 103: ADD R3, R1, R2 处 重新 开始 执行 。 

a. R1=2; R2=5; R3= 位置 未 知 (因为 中 断 使 得 ADD 指令 结束 ) 

MEM{[2000] = 2; MEM[2002] = 5; MEM[2004] 未 知 ; (因为 中 断 使 得 SW 指令 被 结束 S); MEM[2006]=3 

b. 传递 给 INT 阶段 的 PC 值 就 是 ADD 指令 的 地 址 即 103， 也 就 是 程序 在 中 断 结束 以 后 开始 运行 
的 地 方 。 


之 前 的 讨论 主要 关心 外 部 中 断 导 致 的 程序 不 连续 性 。 对 于 陷入 和 异常 ， 我 们 别 无 选择 ， 
只 能 让 之 前 的 指令 完成 ( 即 排 干 )， 而 冲刷 掉 之 后 的 指令 ， 人 然后 进入 INT 状态 ， 把 导致 陷入 / 
异常 的 指令 的 PC 值 传递 给 它 。 


5.15 ”处 理 器 设计 的 高 级 话题 


流水 线 处 理 器 设计 始 于 20 世纪 60 和 70 年代， 那 是 个 高 性 能 大 型 机 和 回 量 处 理 吾 的 时 
代 。 很 多 在 那个 时 代 发 明 的 概念 在 现代 处 理 需 设计 里 仍然 很 有 用 。 在 本 节 中 ,我 们 将 会 回顾 
处 理 器 设计 里 的 一 些 高 级 概念 ， 包 括 当 前 流水 线 处 理 豆 的 最 新 进展 。 


5.15.1 指令 级 并 行 


流水 线 处 理 器 有 一 点 很 好 的 地 方 : 就 是 它 不 用 修改 串 行 编程 模型 的 观念 。 也 就 是 说 ， 从 
程序 员 的 角度 来 说 ， 第 3 章 中 介绍 的 一 个 简单 处 理 器 跟 本 章 介 绍 的 流水 线 处 理 需 是 没有 区 
别 的 。 程 序 的 指令 看 起 来 执行 的 顺序 与 程序 员 所 写 的 完全 一 样 。 原 始 程序 里 的 指令 出 现 的 
顺序 被 称 作 程序 顺序 。 流 水 线 处 理 器 通过 识别 程序 中 相 邻 的 相互 独立 的 指令 来 缩短 它 的 执 
行 时 间 ， 因 此 ， 这 些 指 令 的 执行 时 间 可 能 会 互相 重 倒 。 指 令 级 并 行 (ILP，Instruction-Level 
Parallelism) 就 是 给 指令 之 间 可 能 出 现 的 重 释 而 起 的 名 字 。 指 令 集 并 行 是 程序 的 一 个 属性 ， 
是 一 种 通常 被 称 作 隐 式 并 行 的 并 行 性 ， 因 为 原始 程序 是 串 行 的 。 在 第 12 章 中 ,我 们 将 会 讨 
论 开发 显 式 并 行程 序 的 技术 ， 以 及 支持 它 的 体系 结构 和 操作 系统 。 流 水 线 处 理 帮 利用 指令 
级 并 行 来 为 品行 程序 获得 性 能 提升 。 读 者 立刻 可 以 看 出 ， 冒 ss 
险 限 制 了 指令 级 并 行 。 尤 其 是 控制 冒险 ， 是 试图 利用 指令 级 OP | et aaa 
HATA. RARE AK EE RT SIA A or Ay ADD 
指令 串 的 (参见 图 5-19 )。 在 图 5-19 中 ， 第 一 个 基本 块 中 可 BeEa 
用 的 指令 集 并 行 的 量 是 4， 而 第 二 个 基本 块 的 是 3。 实 际 上 流 be) wa on 
水 线 处 理 器 可 以 利用 到 的 并 行 性 还 要 受 本 章 中 提 到 的 其 他 类 Be 
型 的 冒险 (数据 和 结构 ) 的 限制 。 图 5.19 ”基本 块 和 指令 级 并 行 

关于 处 理 器 的 设计 和 实现 ,我 们 只 讲 了 冰山 一 角 。 例 如 ， 





译 者 注 
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对 于 避免 流水 线 各 个 阶段 之 间 的 共享 资源 需求 的 冲突 (例如 寄存 器 堆 和 ALU) 我 们 只 介绍 了 
很 便 单 的 机 制 ， 使 得 处 理 器 实现 可 以 完全 利用 可 用 的 指令 集 并 行 性 。 而 且 ， 我们 还 讨论 了 解 
决 控制 冒险 的 简单 方案 ， 让 处 理 器 可 以 利用 跨越 多 个 基本 块 的 指令 集 并 行 。 多 发 射 处 理 器 已 
经 成 为 行业 标准 ,但 是 对 体系 结构 提出 了 新 的 挑战 。 


5.15.2 更深 的 流水 线 


现代 处 理 需 的 深度 经 常 远 高 于 $。 璧 如 说 ，Intel Pentium 4 处 理 器 就 有 超过 20 个 流水 线 阶 
段 。 但 是 ， 由 于 编译 生成 的 代码 里 分 支 的 频率 很 高 ， 典 型 的 基本 块 尺寸 会 很 小 (大 约 在 3 到 ?7 
之 间 )。 因 此 ， 要 想 让 流水 线 处 理 髓 值得 采用 ， 用 聪明 的 技术 来 利用 基本 块 间 的 指令 级 并 行 就 
势 在 必 行 。 微 体系 结构 的 领域 里 包含 无 数 种 提升 处 理 器 性 能 的 手段 ， 令 人 着 迷 ， 同 时 又 不 断 
演化 。 在 第 3 章 中 ,我 们 提 到 过 多 发 射 处 理 器 ， 其 中 超标 量 和 超 长 指令 字 是 两 种 特例 。 指 令 
发 射 是 指 把 一 个 指令 送 进 处 理 器 流水 线 以 执行 的 过 程 。 在 我 们 迄今 为 止 考虑 的 五 阶段 流水 线 
里 面 ， 每 个 时 钟 周 期 恰好 发 送 一 条 指令 。 从 多 发 射 处 理 器 的 名 字 就 可 以 看 出 ， 它 们 每 个 时 钟 
周期 里 发 射 多 条 指令 。 作 为 近似 ， 让 我 们 假设 硬件 和 编译 器 会 确保 同一 个 时 钟 周 期 内 被 发 射 
的 指令 没有 我 们 讨论 过 的 任何 冒险 ， 所 以 它们 可 以 独立 执行 。 那 么 ， 处 理 器 就 得 有 多 个 解码 
单元 和 多 个 功能 单元 (如 整数 算术 单元 、 浮 点 算术 单元 、 加 载 /存储 器 等 ) 来 满足 同一 时 钟 周 
期 发 射 的 指令 的 不 同 需 求 (参见 图 5-20 )。 取 指令 单元 将 会 从 内 存 读 取 多 条 指令 以 利用 多 个 解 
码 单元 。 解 码 单元 也 得 能 把 解码 的 指令 发 给 多 个 功能 单元 中 的 任意 一 个 功能 单元 。 





图 5-20 多 发 射 处 理 顺 的 流水 线 


这 样 的 处 理 器 的 有 效 吞 吐 量 接近 于 流水 线 级 数 和 超标 量度 数 的 乘积 。 换 名 话说， 现代 处 
理 器 不 但 流水 线 很 深 ， 而 且 还 有 好 几 条 流水 线 在 并 行 执 行 。 深 度 流水 和 超标 量 对 体系 结构 和 
系统 软件 的 开发 者 〈 尤 其 是 编译 器 作者 ) 提出 了 几 个 有 趣 的 挑战 。 
你 也 许 会 怀疑 深度 流水 线 到 底 有 没有 必要 。 和 采用 深度 流水 线 有 以 下 几 个 理由 : 
。 访 存 时 间 的 相对 增加 在 第 3 章 ， 我 们 提 到 过 数据 通路 里 延迟 的 组 成 部 分 。 由 于 必 片 
上 的 特征 越 来 越 小 ， 线 缆 延 迟 ( 即 在 数据 通路 元 素 之 间 传 递 数 据 位 的 成 本 ) 取代 逻辑 操 
作成 为 决定 时 钟 周期 时 间 的 瓶颈 。 但 是 ， 从 寄存 器 或 者 缓存 里 取 值 (我 们 将 在 第 9 REP 
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绥 存 谈 取 数据 花费 多 个 周期 可 能 是 必要 的 。 这 就 增加 了 需要 从 缓存 取 值 的 部 件 的 复杂 
度 ， 也 就 增加 了 整个 处 理 右 的 复杂 程度 。 把 花费 多 个 时 钟 周期 进行 的 特定 操作 拆 成 多 
个 阶段 来 执行 是 一 种 解决 这 类 复杂 性 的 办 法 . 

访问 微 码 ROM 在 第 3 章 我 们 介绍 了 指令 的 微 程序 实现 。 尽 管 该 技术 有 它 的 问题 ， 流 
水 线 处 理 融 还 是 可 以 考虑 采用 它 来 实现 指令 集中 的 某 些 复杂 指令 。 访 问 微 码 ROM 可 能 
会 使 流水 线 深度 增加 。 

多 个 功能 单元 ”现代 处 理 需 的 指令 集 包 括 整 数 运 算 和 浮 点 运算 。 微 体系 结构 通常 会 包 
含 针 对 浮 点 加 减 乘 除 运 算 而 与 整数 ALU 区 分 的 专门 功能 单元 。 简 单 五 阶段 流水 线 中 的 
EX 单元 被 一 组 功能 单元 的 集合 所 替代 (参见 图 5-20 )。 为 了 调度 多 个 功能 单元 ， 可 能 
需要 一 个 额外 的 流水 线 阶段 . 

浮 点 运算 专用 流水 线 ” 浮 点 指令 与 相应 的 整数 指令 相 比 需要 更 多 的 时 间 来 执行 。 在 简 
单 五 阶段 流水 线 里 最 慢 的 功能 单元 将 会 决定 时 钟 周 期 时 间 。 因 此 ， 自 然 会 想 把 功能 单 
元 本 身 也 弄 成 流水 线 ， 于 是 我 们 得 到 的 结构 类 似 于 图 5-21， 其 中 不 同 的 功能 单元 有 不 
同 的 流水 线 深度 。 这 种 差异 化 的 流水 线 可 以 支持 多 个 延迟 特别 长 的 操作 (如 浮 点 数 的 
ADD )， 而 不 会 因为 结构 冒险 拖延 整个 流水 线 。 


加 载 / 存储 内 存 


整数 算术 运算 
浮 点 加 法 
一 ~ 


浮 点 除 





图 5-21 不 同 功能 单元 有 不 同 深度 的 流水 线 


乱 序 执行 和 重 排 缓存 ”回忆 一 下 ,流水 线 处 理 右 无 论 怎么 利用 指令 级 并 行 ， 都 应 当 保 
留 程序 的 顺序 执行 。 由 于 不 同 指令 可 能 会 在 流水 线 中 采取 不 同 的 让 路 ， 维 持 这 种 看 上 
去 的 序列 性 就 变 得 更 复杂 。 因 此 ， 现 代 处 理 需 区 分 发 射 顺 序 和 完成 顺序 这 两 个 概念 。 
取 指 令 单元 按 顺序 发 射 指令 。 但 是 ， 由 于 不 同 的 流水 线 深 度 不 同 以 及 其 他 一 些 原因 【〈 比 
如 执行 指令 需要 等 待 某 个 操作 数 )， 指 令 可 以 乱 序 执行 和 完成 。 我 们 发 现 ， 只 要 指令 按 
照 程 序 顺序 从 处 理 器 引退 ， 就 不 会 有 问题 。 换 句 话 说 ,一 条 指令 即使 执行 完毕 ， 也 会 
一 直 等 到 所 有 之 前 的 指令 都 执行 完 才 引退 。 为 了 确保 这 一 点 ， 现 代 处 理 融 添加 了 一 种 
可 能 是 流水 线 的 额外 阶段 的 机 制 。 有 具体 来 说 是 这 样 : 流水 线 包含 一 个 重 排 缓存 (Reorder 
Buffer，ROB )， 用 于 将 完成 执行 的 指令 按 程序 顺序 引退 。 重 排 缓 存 确 保 指 令 完 成 的 效 
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东 (〈 即 写 人 对 体系 结构 可 见 的 寄存 器 、 读 取 或 者 写 和 内存) 的 生效 在 之 前 的 所 有 指令 

后 。 它 通过 记录 发 射 时 的 指令 的 程序 顺序 ， 并 将 需要 发 送 到 体系 结构 可 见 的 寄存 器 和 
内 存 的 数据 与 地 址 缓存 下 来 来 实现 这 一 点 。 在 有 重 排 缓存 存在 的 情况 下 ， 读 取 寄 存 器 
时 仍然 需要 考虑 写 后 读 的 依赖 关系 ， 如 我 们 在 5.13.2 节 中 已 经 讨论 的 那样 。 

寄存 器 重 命 名 : 之 前 我 们 提 到 过 程序 依赖 ， 尤 其 是 反 依 赖 和 输出 依赖 主要 是 由 于 编译 
香油 进 地 重用 寄存 器 引起 的 (参见 5.13.2 节 )。 这 表现 为 流水 线 处 理 器 中 的 读 后 写 和 写 
后 写 冒 险 。 为 了 克服 这 些 骨 险 ， 现 代 处 理 需 的 物理 寄存 器 比 体 系 结构 可 见 的 寄存 器 数 
量 多 一 些 。 处 理 器 可 能 会 花 一 个 周期 来 检测 某 些 资源 冲突 ， 然 后 通过 一 种 称 作 寄存 器 
重 命名 2 的 技术 来 区 分 对 寄存 器 的 不 同 使 用 。 寄 存 器 的 重 命名 是 在 指令 里 称呼 的 体系 结 
构 寄存 硕 和 指令 用 到 的 实际 物理 寄存 器 之 间 的 一 层 间 接 对 应 关系 。 我 们 将 会 在 本 节 的 
稍 后 部 分 ， 在 介绍 完 Tomasulo 算法 后 详细 讨论 这 个 问题 。 

基于 硬件 的 投机 执行 : 为 了 克服 控制 冒险 ， 完 全 利用 多 发 射 能 力 ， 很 多 现代 处 理 器 采 
用 了 基于 硬件 的 投机 执行 ,一 种 对 分 支 预 测 的 扩展 。 这 个 想法 是 不 等 待 分 支 的 解决 ， 
而 同时 执行 不 同 基 本 块 里 的 指令 ， 人 然后 设立 机 制 来 撤销 由 于 投机 而 错误 执行 了 的 代码 
的 效果 。 重 排 缓存 和 硬件 寄存 需 重 命名 都 有 助 于 基于 硬件 的 投机 执行 ， 这 是 因为 ,在 
物理 寄存 器 或 者 重 排 缓存 里 的 信息 如 果 用 于 投机 执行 ， 并 之 后 被 发 现 这 次 执行 的 结果 
不 该 生效 时 ， 是 很 容易 丢掉 的 。 


5.15.3 ”在 乱 序 执行 下 再 次 讨论 程序 不 连续 性 


在 5.14 节 我 们 讨论 了 流水 线 处 理 器 里 处 理 中 断 的 简单 机 制 。 让 我 们 来 看 看 有 乱 序 执行 以 
后 处 理 中 断 有 什么 变化 。 一 些 早期 的 处 理 器 如 CDC 6600 和 IBM 360/91， 用 乱 序 执行 来 克服 
数据 冒险 和 结构 冒险 导致 的 流水 线 拖延 。 基 本 的 想法 是 按 顺 序 发 射 指令 ， 但 是 让 指令 一 旦 操 
作 数 可 用 了 就 立刻 开始 执行 。 这 种 乱 序 执行 加 上 不 同 指 令 需 要 花 不 同时 间 这 一 事实 ， 结 果 就 
是 指令 会 乱 序 完成 执行 并 引退 。 也 就 是 说 ， 指 令 不 只 是 乱 序 地 完成 执行 ， 而 且 还 是 乱 序 地 更 
新 处 理 器 状态 〈( 即 体系 结构 可 见 的 寄存 器 和 内 存 )。 这 样 做 有 问题 吗 ? 看 起 来 没有 ， 因 为 这 些 
早期 的 流水 线 处 理 器 确实 按 程序 顺序 发 射 指令 ， 也 考虑 了 指令 之 间 的 数据 依赖 关系 ， 也 从 来 
不 投机 地 执行 任何 指令 。 外 部 中 断 对 于 乱 序 执行 来 说 也 构 不 成 什么 问题 ， 因 为 我 们 可 以 采取 
一 种 非常 简单 的 解决 方案 ， 即 停止 发 射 新 指令 ， 并 让 所 有 已 经 发 射 的 指令 完成 执行 ， 然 后 进 
入 中 断 。 

但 是 ， 异 常 和 陷入 确实 会 有 问题 ， 因 为 引发 异常 的 指令 之 后 的 指令 可 能 已 经 执行 完了 了 。 
这 种 情况 被 定义 为 非 精 确 异 常 ， 以 说 明 发 生 异 常 时 的 处 理 器 状态 与 程序 顺序 执行 时 并 不 同 。 
早期 的 流水 线 处 理 器 通过 软件 ( 即 在 异常 处 理 例 程 中 )， 或 者 通过 提前 检测 长 延 时 (如 浮 点 运 
算 ) 操作 中 的 异常 硬件 技术 ,来 恢复 处 理 需 异常 状态 。 

我 们 在 上 一 节 中 已 经 看 到 ， 现 代 处 理 器 尽管 乱 序 执行 ， 但 是 会 按照 程序 顺序 进行 引退 。 
这 自动 消除 了 非 精确 异常 的 可 能 性 。 可 能 的 异常 会 被 缓存 到 重 排 缓存 里 ， 然 后 严格 按照 程序 
的 顺序 出 现 。 

关于 流水 线 处 理 器 中 中 断 的 详细 讨论 超出 了 本 书 的 范畴 。 有 兴趣 的 读者 可 以 参考 计算 机 
体系 结构 方面 的 高 级 课本 [Hennessy，2006]。 
日 注意， 寄存 器 重 命名 也 可 以 由 编译 器 进行 。 编 译 器 可 以 在 进行 程序 优化 时 发 现 数据 冒险 并 进行 重合 名。 这 

时 候 流水 线 里 就 不 需要 一 个 额外 的 阶段 了 。 
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5.15.4 管理 共享 资源 


有 了 多 个 功能 单元 以 后 ， 管 理 共享 资源 (如 寄存 器 堆 ) 就 更 加 困难 了 。 一 个 被 CDC6600 
推广 的 技术 是 记分 板 ， 一 种 用 于 处 理 我 们 本 章 先 前 讨论 过 的 各 种 类 型 的 数据 冒险 的 技术 。 基 
本 的 想法 是 有 一 个 叫做 记分 板 的 集中 装置 ， 它 在 一 条 指令 进入 流水 线 时 就 记 下 它 会 用 到 的 资 
源 。 在 拖延 一 条 指令 和 让 它 继续 向 下 执行 之 间 做 出 的 决定 取决 于 该 指令 当前 所 需 的 资源 。 例 
如 ， 如 果 有 与 后 谈 冒 险 ， 那 么 需要 读 一 个 即将 被 之 前 指令 写 和 的 寄存 器 的 指令 就 会 被 一 直 拖 
延 到 记分 板 显示 该 资源 已 经 可 用 (前 一 条 指令 把 值 写 人 寄存 器 时 ) 为 止 。 因 此 ， 记 分 板 记 录 了 
流水 线 里 所 有 指令 的 资源 需求 。 注 意 ， 给 寄存 器 堆 里 的 每 个 寄存 器 配置 忙 位 和 等 待 读 取 位 就 
已 经 为 简单 五 阶段 流水 线 实现 了 一 记分 板 。 

IBM 公司 的 Robert Tomasulo 想 出 了 一 个 聪明 的 算法 (以 他 的 名 字 命 名 )。 该 算法 是 个 流 
水 线 处 理 器 中 资源 共享 和 分 配 问 题 的 分 布 式 的 解决 方案 。 该 解决 方案 首次 被 应 用 是 应 用 于 

219| IBM360/91， 最 早 的 (在 20 世纪 60 年 代 ) 采用 流水 线 原 理 的 计算 机 之 一 。 基 本 的 思想 是 (以 
本 地 寄存 需 的 形式 ) 把 每 个 功能 单元 与 存储 相关 联 。 在 指令 发 射 的 时 候 ， 需 要 的 寄存 上 硕 值 会 
被 传递 到 这 些 本 地 寄存 器 ?， 从 而 避免 了 读 后 写 冒 险 。 如 果 (由 于 写 后 读 冒 险 ) 寄存 器 值 不 可 
用 ,那么 本 地 寄存 需 就 记 住 它们 应 当 从 哪个 单元 得 到 这 个 值 。 在 一 条 指令 被 执行 完毕 以 后 ， 
这 个 控制 单元 会 把 新 的 寄存 需 值 通过 公共 数据 总 线 (CDB, Common Data Bus) 发 送 给 寄存 器 
堆 。 其 他 等 待 这 个 值 的 功能 单元 (可 能 多 于 一 个 ) 把 它 从 总 线 里 读 出 来 ， 开 始 执行 各 上 自 的 指 
令 。 由 于 寄存 器 堆 总 是 与 其 他 功能 单元 以 相同 方式 工作 ， 它 也 会 记 住 哪个 单元 将 要 给 哪个 寄 
人 存 器 产生 值 ， 也 就 可 以 避免 写 后 写 冒 险 。 这 样 ， 这 个 分 布 式 的 解决 方案 避免 了 我 们 迄今 为 目 
讨论 过 的 所 有 潜在 的 数据 冒险 。 

Tomasulo 算法 的 核心 思想 在 于 使 用 本 地 寄存 天 来 作为 体系 结构 可 见 的 寄存 器 的 代理 。 现 
代 处 理 需 通过 把 Tomasulo 算法 里 用 到 的 所 有 分 布 式 的 存储 集中 到 一 个 大 型 的 物理 寄存 器 堆 里 
来 使 用 这 个 想法 。 我 们 先前 提 到 的 寄存 器 重 命名 技术 产生 了 从 体系 结构 可 见 的 寄存 右 到 物理 
寄存 器 的 动态 上 映射。 例如， 如 果 RI 是 个 体系 结构 可 见 的 寄存 器 ， 是 某 个 存储 指令 的 源 寄存 
器 ， 而 实际 分 配 到 的 物理 寄存 器 是 ， 比 如 说 ，P12， 那 么 R1 的 值 就 在 寄存 需 重 命名 的 阶段 被 
换 成 P12。 因 此 ， 寄 存 器 重 命名 阶段 负责 动态 为 指令 分 配 物 理 寄存 器 。 本 质 上 ， 寄 存 器 重合 
名 消除 了 读 后 写 和 写 后 写 数据 冒险 。 我 们 已 经 在 5.13.2 节 讨 论 过 数据 前 递 怎么 在 流水 线 寄存 
器 里 解决 写 后 读 冒 险 。 因 此 ， 寄 存 器 重 命 名 加 上 数据 前 递 就 处 理 了 现代 处 理 器 中 的 所 有 数据 
冒险 。 负 责 寄 存 器 重 命名 的 流水 线 阶 段 留 意 任 意 时 刻 哪 些 寄 存 器 在 被 使 用 ， 以 及 它们 什么 时 
候 会 由 于 指令 的 引退 而 被 释放 (与 CDC 6600 中 的 计 分 板 技 术 何 其 相似 )。 

重 排 缓存 的 作用 是 确保 指令 按照 程序 顺序 引退 。 寄 存 器 重 命名 的 作用 是 消除 数据 冒险 ， 
以 及 支持 基于 硬件 的 投机 执行 。 一 些 处 理 器 干脆 把 重 排 缓 存 也 去 掉 了 ， 把 它 的 功能 〈 即 按 程 
序 顺序 引退 指令 ) 集成 到 寄存 占 重 命名 机 制 里 面 去 。 

让 我 们 重新 回顾 写 后 写 冒 险 。 我 们 已 经 看 过 在 早期 流水 线 机 器 里 采用 的 技术 (诸如 计 分 
板 和 采用 Tomasulo 算法 )， 也 看 过 现代 处 理 器 里 使 用 的 技术 (诸如 寄存 器 重 命名 和 重 排 缓 存 )， 
都 能 在 乱 序 执行 的 情况 下 消除 写 后 写 冒 险 。 投 机 执行 会 导致 写 后 写 冒 险 吗 ? 答案 是 否 ， 因 为 
尽管 用 了 投机 执行 ， 指 令 还 是 会 以 程序 顺序 引退 。 任 何 由 于 分 支 错误 预测 而 产生 的 对 寄存 需 

[220] 的 错误 写 入 都 会 在 生效 之 前 从 重 排 缓 存 里 删除 。 


© Tomasulo 算法 里 的 这 些 本 地 寄存 器 起 到 的 作用 与 支持 寄存 器 重 命名 的 现代 处 理 器 中 的 大 寄存 器 堆 相同 。 
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尽管 我 们 有 多 发 射 处 理 器 、 投 机 执行 和 乱 序 执行 ， 但 是 在 5.13.2 4 oH He ATE BE 
决 ， 即 ， 编 译 器 为 什么 会 生成 有 写 后 写 冒 险 的 代码 ? 答案 就 在 于 编译 器 也 许 用 前 一 个 写 人 填 
充 了 一 个 延迟 槽 (如 果 该 体系 结构 用 了 延迟 分 支 的 话 )， 然 后 进行 了 一 次 未 预测 到 的 跳 转 ， 使 
得 前 一 次 写 入 没有 用 上 。 更 一 般 地 来 说 ， 写 后 写 冒险 可 能 由 于 意料 之 外 的 代码 而 出 现 。 另 一 
个 例子 是 当前 在 执行 的 程序 和 陷入 处 理 代码 之 间 的 交互 。 假 设 一 个 指令 由 于 某 种 原因 ， 如 果 
遇 到 陷入 的 话 会 把 值 写 入 某 个 寄存 器 (第 一 次 写 人 )。 而 陷 人 的 处 理 代码 的 某 处 则 写 入 到 同一 
个 寄存 器 (第 二 次 写 人 )。 该 指令 继续 执行 并 完成 把 值 写 人 寄存 器 ( 即 程序 顺序 中 的 第 一 次 写 
入 ,现在 由 于 陷入 处 理 的 缘故 变 得 不 相干 了 )。 如 果 写 人 不 按 照 程序 顺序 发 生 的 话 ， 那 么 第 一 
次 写 人 将 会 覆盖 掉 陷入 处 理 代码 的 第 二 次 写 和 人。 检测 和 消除 此 类 冒险 是 硬件 的 职责 。 


5.15.5 Tht 


另 一 个 处 理 器 设计 的 有 趣 维度 是 关心 功 耗 。 即 使 在 当今 的 技术 水 平 下 ， 现 在 的 GHz 微 处 
理 器 仍然 挥霍 着 大 量 的 电力 ， 以 至 于 保持 系统 冷却 是 个 重要 的 工程 挑战 。 而 随 着 处 理 能 力 持 
续 增 加 ， 能 量 消耗 也 随 之 增加 。 体 系 结构 设计 者 的 挑战 是 追求 更 高 性 能 的 同时 保持 低 功 耗 。 

具有 在 一 片 硅 片 上 塞 进 更 多 品 体 管 的 能 力 是 件 幸 事 ， 但 是 它 也 对 体系 结构 设计 者 市 来 了 
重大 的 挑战 。 首 先 ， 世 片 中 晶体 管 的 密度 提高 之 后 ， 所 有 的 延 色 (回忆 一 下 在 第 3 章 中 讨论 
过 的 时 钟 脉 冲 宽度 ) 都 减 小 了 。 这 包括 进行 逻辑 运算 花费 的 时 间 、 线 路 延迟 以 及 寄存 需 的 访 
问 时 间 。 这 就 对 体系 结构 设计 者 带 来 如 下 挑战 : 原则 上 说 ， 因 为 延迟 减 小 了 ,芯片 可 以 提 
升 到 更 高 的 频率 。 但 是 ， 提 升 频 率 会 增加 功 耗 。 图 5-22 展示 了 提升 时 钟 频 率 为 几 种 流行 的 
处 理 器 带 来 的 功 耗 提升 。 你 能 看 到 时 钟 周期 时 间 与 功 耗 之 间 的 高 度 相 关 性 。 一 块 3.2GHz 的 
IntelPentium 4 处 理 器 要 消耗 112 瓦 的 功率 。 在 表 中 ， 你 能 看 到 有 些 时 钟 频率 更 低 的 处 理 硕 消 
耗资 源 更 高 (比如 说 ， 比 较 一 下 1.8 GHz 的 AMD K8 和 2.2 GHz 的 Intel P4 )。 原 因 是 功 耗 也 
取决 于 其 他 芯片 上 的 资源 ， 比 如 说 处 理 器 的 字 长 和 包括 片上 缓存 在 内 的 内 存 系统 。( 我 们 将 在 
第 9 章 讨论 缓存 的 设计 。) 


Intel P4 (32 位 ) 3.2 GHz @ 14 =e 

AMD K8 (64 位 ) 2.2 GHz Athlon 64 @ 1.50 V 
AMD K8 (64 位 ) 2.0 GHz Athlon 64 @ 1.40 V EEE 
AMD K8 (64 位 ) 1.8 GHz Athlon 64 @ 1.30 V 
=} Intel P4 (32 位 ) 2.2 GHz mobile Celeron @ 1.3 VERE 
X Intel P4 (32 位 ) 2.0 GHz mobile Celeron @ 1.3 V EEE 
Intel P4 (32 位 ) 1.8 GHz mobile Celeron @ 1.3 VEER 
AMD K8 (64 位 ) 1.0 GHz Athlon 64 @ 1.10 V 


0 20 40 60 80 100 120 
最 大 功 耗 (BL) 


fire AY 





图 5-22 CPU 功 耗 S 时 钟 频 率 对 功 耗 有 重大 影响 。 其 他 诸如 处 理 器 字 长 和 其 他 片上 资源 
(包括 缓存 ) SRA th nl DFE 


5.15.6 ”多 核 处 理 器 设计 


现实 情况 是 ， 随 着 技术 的 进步 ， 如 果 处 理 器 的 时 钟 频率 调 到 技术 允许 的 上 限 ， 我 们 很 快 就 
会 有 功 耗 等 于 核电 站 的 笔记 本 电脑 出 现 。 当 然 了 ， 解 决 方案 不 是 停止 制造 密度 更 高 、 时 钟 频率 221) 


O Vi: Intel 的 数据 来 自 www.sandpile.org/impl/p4.htm。AMD 的 数据 来 自 www.sandpile.org/impl/k8.htm. 
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更 快 的 芯片 。 体 系 结构 设计 者 在 转 回 另 一 条 不 需要 提升 时 钟 周 期 而 可 以 提升 处 理 器 性 能 的 道路 ， 
即 多 处 理 硕 。 该 新 技术 已 经 以 多 核 的 名 称 被 投入 市 场 (如 Intel Core 2 Duo, AMD Opteron 四 核 
处 理 融 等 )。 每 个 芯片 里 装着 多 个 处 理 器 ， 而 运算 则 被 这 多 个 处 理 器 共同 分 担 ， 系 统 的 吞吐 量 
( 即 性 能 ) 从 而 增加 。 多 核 处 理 硕 (也 经 浓 被 称 为 芯片 多 处 理 器 ) 的 体系 结构 和 硬件 细节 超出 了 
本 书 的 讨论 范畴 。 但 是 ， 多 核 技 术 建 立 在 并 行 计算 的 基础 上 ， 而 后 者 的 历史 与 计算 机 科学 一 样 
悠久 。 我 们 将 会 在 第 12 章 围 绕 多 处 理 器 更 详细 地 讨论 遇 到 的 硬件 和 软件 问题 。 


5.15.7 Intel Core S 微 架构 : 一 个 流水 线 


了 解 现 代 处 理 需 的 流水 线 结 构 是 有 益 的 。 采 用 Willamette 和 Galatin fot 38 4) AY Intel 
Pentium 4 采用 了 20 阶段 的 流水 线 ， 而 基于 Prescott 和 Irwindale 微 架 构 的 则 采用 了 31 阶段 的 
流水 线 。Intel 和 AMD 公司 的 产品 (虽然 两 者 都 支持 相同 的 x86 指令 集 ) 之 间 的 一 个 重大 区 别 
就 是 流水 线 的 深度 。Intel 的 路 线 是 采用 更 深 的 流水 线 来 达到 更 高 的 奉 吐 量 ， 而 AMD 则 采用 
了 相对 较 浅 ( 14 阶段 ) 的 流水 线 。 

Intel 处 理 器 的 一 个 系列 包括 Intel Core 2 Duo, Intel Core 2 Quad 和 Intel Xeon 处 理 需 采用 
一 个 共同 的 内 核 微 架构 ， 参 见 图 5-23。 值 得 一 提 的 是 该 流水 线 结构 被 20 世纪 90 年 代 中 期 
的 Pentium“P6” 微 体系 结构 中 首次 采用 。 


图 5-23 被 大 大 简化 了 ， 以 展现 现代 处 理 

售 流 水 线 的 基本 功能 。 读 者 有 兴趣 的 话 每 时 钟 周 期 最 

可 以 去 Intel 的 网 站 参阅 关于 Intel 体 系 多 6 条 指令 

ARAA, DARA, WPAN 

构 分 为 前 端 、 执 行 核 心 以 及 后 端 三 部 分 。 每 时 钟 周期 最 
NEL — 


前 端的 职责 是 按 顺 序 从 内 存 中 获取 指令 ， 
并 用 四 个 解码 硕 来 把 解码 后 的 指令 (也 





BEAK TE GLARE) 提供 给 执行 核心 。 前 端 ps 


ATA Ly, EAT Eh Jii HH Ae T a o DR 


ROM... 而 流水 线 的 中 间 部 分 是 个 乱 序 执 本 


绪 ( 即 没有 写 后 读 冒 险 ) 并 且 对 应 的 执行 重 排 缓 存 一 一 96 项 

单元 可 用 ( 即 没 有 结构 冒险 ) 的 情况 下 可 

以 发 射 高 达 6 条 微 操作 。 这 个 中 间 部 分 zs 

包括 寄存 器 重 命名 ， 重 排 缓存 ， 保 留 站 | 

以 及 一 个 指令 调度 器 。 最 后 ， 后 端 负 责 ; oe be Bb meee 





按照 程序 顺序 引退 指令 ， 以 及 更 新 程序 
员 可 见 的 体系 结构 寄存 项 。Intel Core 流 
水 线 体系 结构 里 出 现 的 不 同 功 能 单元 的 
功能 列举 如 下 : 
。 指 令 获 取 和 预 解码 ”该 单元 负责 两 
件 事情 : 获取 最 可 能 要 执行 的 指 图 5-23 Intel Core 微 体系 结构 的 流水 线 功能 描述 


功能 单元 (整数 ALU, MMX, 
点 加 、 浮 点 乘 、 读 取 内 存 、 


© Intel Core 是 Intel 公司 的 注册 商标 
© Intel 的 网 站 : www.intel.com/products/processor/manuals/index.htm. 


Rb EB BE GE SS oe KAR ALE By 1h tt 151 


令 ， 并 且 通 过 预 解 码 来 识别 变 长 指令 (因为 x86 体系 结构 支持 变 长 指令 )。 预 解码 帮助 
和 令 获 取 需 远 在 分 文 的 结果 产生 之 前 就 找 出 哪些 是 分 支 指 令 。 一 个 精巧 的 分 支 预测 单 

元 ( BPU，Branch Prediction Unit) 是 读 取 最 可 能 执行 的 指令 流 的 阶段 的 一 部 分 。 分 支 
预测 单元 用 专门 的 硬件 来 预测 不 同类 型 的 分 支 指令 (和 条件、 直接、 间接 ， 以 及 调用 函数 
和 返回 ) 的 结果 。 预 解码 单元 可 以 每 个 时 钟 周期 向 指令 队列 中 写 入 至 多 六 条 指令 。 

指令 队列 指令 队列 取代 了 简单 的 五 阶段 流水 线 里 的 指令 寄存 絮 CIR, Instruction 

Register )。 因 为 它 装 了 多 得 多 的 指令 (能 装 18 条 指令 )， 指 令 队 列 能 装 下 原始 程序 中 的 

一 小 段 (如 一 个 小 的 循环 ) 以 加 速 流 水 线 处 理 器 的 执行 。 而 且 ， 它 能 帮助 省 电 ， 因 为 前 

端的 剩 下 部 分 ( 即 取 指 令 单 元 ) 可 以 在 执行 循环 的 时 候 关 掉 。 

。 解码 和 微 码 ROM 该 单元 包含 四 个 解码 天， 因此 可 以 每 个 时 钟 周期 将 指令 队列 中 的 
四 条 指令 解码 。 取 决 于 指令 ， 解码 帮 单元 可 能 会 用 微 码 ROM 将 一 条 指令 扩展 成 多 条 
微 操作 。 微 码 ROM 每 个 周期 可 以 输出 三 条 微 操作 。 通 过 微 码 ROM， 在 不 拖 慢 执行 
简单 指令 的 流水 线 的 情况 下 实现 了 复杂 指令 。 解 码 右 还 支持 宏 合并 ,将 两 条 指令 合并 
成 一 条 微 操作 。 

。 寄 存 器 重 命 名 /分配 ”该 单元 负责 将 物理 寄存 带 分 配给 微 操 作 里 用 到 的 体系 结构 寄存 
器 。 它 记录 了 体系 结构 寄存 器 与 微 体 系 结构 中 的 实际 物理 寄存 需 之 间 的 对 应 关系 。 它 
支持 基于 硬件 的 投机 执行 ， 消 除了 读 后 写 和 写 后 写 冒 险 。 

重 排 缓 存 该 单元 有 96 个 项 目 ， 负责 将 原始 程序 的 微 操 作 按 照 程序 顺序 记录 下 来 以 便 
随后 调度 。 它 把 在 各 个 执行 阶段 的 微 操 作 都 记录 下 来 。 由 于 它 的 尺寸 原因 ， 流 水 线 中 

最 多 有 96 条 微 操作 正在 执行 ( 即 在 执行 的 各 个 阶段 )。 

调度 器 ”该 单元 负责 把 微 操作 分 配给 功能 单元 。 它 包括 一 个 保留 站， 将 所 有 人 微 操 作 排 
队 等 待 它们 所 需 的 资源 就 绪 且 需要 用 到 的 执行 单元 可 用 。 它 每 个 时 钟 周期 可 以 调度 至 
多 6 条 微 操 作 ， 当 然 这 取决 于 有 多 少 指令 为 执行 做 好 了 准备 。 
功能 单元 ”如 名 字 所 上 暗示 的 ， 这 些 是 具体 执行 微 操 作 的 单元 。 它 们 中 有 的 执行 单元 的 
延迟 是 一 个 周期 (诸如 整数 加 法 )， 也 有 一 些 对 于 经 常用 到 的 高 延迟 微 操作 会 采用 流水 

线 化 的 执行 单元 ， 还 有 流水 线 化 的 浮 点 运算 单元 和 内 存 存 取 单元 等 。 

。 引 退 单 元 该 单元 代表 了 微 体系 结构 的 后 端 ， 用 重 排 缓存 来 按 程序 顺序 引退 微 操 作 。 
另外 ， 它 按照 程序 的 顺序 更 新 体系 结构 的 状态 并且 管理 代码 执行 的 时 候 可 能 遇 到 的 
异常 和 陷入 的 顺序 。 它 也 与 保留 站 通信 以 告知 微 操作 在 等 竺 的 资源 是 否 可 用 。 


小 结 


本 章 中 ,我们 讨论 了 很 多 东西 。 我 们 在 5.1 节 和 5.2 节 中 讨论 了 衡量 处 理 硕 性 能 的 标准 ; 
5.5 节 讲 了 阿 姆 达 尔 定律 和 加 速 比 的 概念 ; 在 5.7 节 中 ， 关 于 提升 处 理 器 性 能 的 讨论 引入 了 流 
水 线 处 理 器 的 概念 。5.11 节 和 5.12 节 讨 论 了 支持 指令 流水 线 所 需 的 数据 通路 元 系 ， 以 及 得 到 
适合 流水 线 的 体系 结构 和 实现 所 需 的 最 佳 实践 。 流 水 线 设计 的 祸 星 是 冒险 。 我 们 在 5.13 TE 
介绍 了 流水 线 处 理 器 里 遇 到 的 不 同类 型 的 (结构 、 数 据 、 控 制 ) 冒险 ， 以 及 相应 的 对 策 。 流 水 
线 处 理 器 实现 遇 到 的 另 一 个 坏 手 的 问题 是 处 理 程 序 的 不 连续 性 ， 我 们 在 5.14 节 中 讨论 了 该 问 
题 。 在 5.15 节 里 讨论 了 一 些 与 流水 线 处 理 器 实现 相关 的 高 级 话题 。 最 后 ， 我 们 以 从 计算 机 出 
现 以 来 处 理 器 实现 的 演化 史 作 为 本 草 绪 尾 。 
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历史 回顾 


我 们 当中 的 大 多 数 人 都 对 于 自己 身 处 何 时 何 处 ， 是 否 用 着 全 天 候 供 应 的 自来水 ， 是 否 开 

着 飞驰 的 小 轿车 ， 是 否 在 掌中 使 用 着 高 性 能 的 计算 机 感到 本 就 应 该 如 此 。 当 然 了 ， 大 部 分 人 
会 很 快意 识 到 ， 在 计算 机 技术 短 短 的 历史 里 ， 因 为 集成 电路 的 突破 式 发 展 的 惊人 速度 ， 我 
们 其 实 已 经 走 过 了 很 长 的 一 段 路 。 

回头 看 看 我 们 走 过 的 道路 是 很 有 助 益 的 。 在 20 世纪 60 年代 和 570 年 代 ， 流 水 线 处 理 
器 设计 被 留 给 了 当年 最 高 端的 计算 机 。 在 20 世纪 60 年代， 控制 数据 公司 (Control Data 
Corporation) 和 IBM 公司 的 研究 者 率先 进行 了 流水 线 处 理 器 设计 的 基础 工作 ， 并 因此 设计 出 
了 诸如 CDC 6600, IBM 360 和 370 系列 等 高 端 计算 机 系统 。 这 样 的 系统 被 称 作 大 型 机 ， 估 
计 是 因为 它们 被 塞 进 一 个 大 金属 机 柜 里 的 缘故 。 它 们 主要 定位 于 商业 应 用 。IBM 360 系列 的 
体系 结构 总 设计 师 是 吉 恩 . 阿 姆 达尔 ， 他 的 名 字 随 着 阿 姆 达尔 定律 一 起 名 垂青 史 ， 他 在 设计 
WISC 计算 机 时 发 现 了 流水 线 的 原理 ， 并 在 他 的 1952 年 于 威斯康辛 大 学 麦迪 逊 分 校 的 博士 论 
文 里 记录 了 下 来 。 Seymour Cray 是 高 性 能 计算 机 的 先锋 ， 成 立 了 Cray Research 公司 ， 该 公 
司 用 以 Cray-1 开始 的 Cray 系列 计算 机 引领 了 向 量 超级 计算 机 的 时 代 。 在 成 立 Cray Research 
ZA, Seymour Cray 是 控制 数据 公司 的 体系 结构 总 设计 师 ， 而 该 公司 在 20 世纪 60 年 代 是 高 
性 能 计算 领域 的 领先 者 ， 生 产 了 CDC 6600 (通常 被 认为 是 第 一 台 商 用 的 超级 计算 机 ) 以 及 紧 
随 其 后 的 CDC 7600. 

在 高 端 计算 机 发 展 的 同时 ， 人 们 对 小 型 计算 机 的 开发 也 充满 了 兴趣 ，DEC 公司 的 PDP 系 
列 以 PDP-8 型 机 引领 道路 ， 紧 接着 是 PDP 11， 再 之 后 是 VAX 系列 机 器 。 这 些 计算 机 起 初 是 
面向 科学 和 工程 社区 的 ， 因 此 其 优先 目标 是 低 成 本 而 不 是 高 性 能 。 因 此 ， 这 些 处 理 吉 被 设计 
成 不 采用 流水 线 技术 。 

我 们 已 经 在 第 3 章 观 察 到 ， 随 着 20 世纪 80 年 代 “ 和 杀手 级 微 处 理 器 ”的 出 现 ， 加 上 在 编 
译 器 技术 和 RISC 体系 结构 中 的 开创 性 研究 ， 为 指令 流水 成 为 除了 极 低 端的 秆 人 式 处 理 融 之 
外 的 所 有 处 理 器 设计 的 常态 铺 平 了 道路 。 现 在 ， 即 使 是 学 步 的 小 孩 玩 的 游戏 机 ， 里 面 采 用 的 
处 理 器 也 是 流水 线 的 。 

最 后 来 澄清 一 下 用 词 ， 超 级 计算 机 是 被 设计 成 用 来 求解 有 挑战 性 的 科学 和 技术 领域 遇 到 
的 计算 问题 的 。 这 些 大 挑战 问题 激发 DARPA 9 开展 研究 项 目 以 求 刺激 人 们 寻找 突破 性 的 计算 
机 技术 。 当 时 ， 大 型 机 用 于 商业 ， 金 融和 其 他 方面 的 技术 应 用 。 而 现今 ， 这 种 高 端 计算 机 一 
般 被 称 作 服务 器 。 服 务 器 组 成 由 高 速 网 络 相连 的 计算 机 的 计算 机 组 ， 也 被 称 作 机 群 。 服 务 硕 
既 用 于 科学 应 用 (如 IBM 的 BlueGene 的 大 规模 并 行 体系 结构 )， 也 用 于 技术 应 用 (如 TBM 的 
z 系列 )。 用 于 搭建 这 种 服务 器 的 处 理 器 十 分 相似 ， 并 且 也 同样 遵循 我 们 在 本 章 中 讨论 的 流水 
线 原则 。 


练习 题 


1. 判断 对 错 ， 并 给 出 理由 : 对 于 特定 的 负载 和 特定 的 指令 集 ， 降 低 所 有 指令 的 CPI 每 指令 的 时 钟 周 期 数 ) 
一 定 会 提升 处 理 器 的 性 能 。 
2. 某 体 系 结构 有 三 类 指令 ， 它 们 的 CPI 如 下 : 


© ÆW: http://en.wikipedia.org/wiki/Wisconsin_Integrally_Synchronized_Computer. 
© DARPA 是 一 个 美国 联邦 政府 机 构 ， 国 防 部 先进 研究 项 目 局 。 
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类 型 CPI 
A 2 
B 5 
C 3 


一 个 体系 结构 设计 师 发 现 他 可 以 用 某 种 聪明 的 体系 结构 小 技巧 来 将 B 类 指令 的 CPI 减 少 ， 而 另 
外 两 种 指令 的 CPI 不 变 。 但 是 ， 她 发 现 这 个 改动 同时 也 会 把 时 钟 周 期 时 间 增 加 15%。 为 了 让 这 个 改 
动 有 意义 ，B 的 最 大 可 允许 CPI (四 舍 五 人 到 最 近 整 数 ) BAD? 假设 她 要 在 这 个 处 理 器 上 执行 的 所 
有 负载 中 A 占 40%，B 占 10%，C 占 50%. 

3. 如 果 处 理 需 时 钟 频率 是 8MHz， 且 每 个 指令 都 需要 花 4 个 时 钟 周期 的 话 ， 执 行 一 个 有 2 000 000 
条 指令 的 程序 需要 花 多 入 ? 

4. 一 个 聪明 的 体系 结构 设计 师 重 新 实现 了 一 个 给 定 的 指令 集 ， 将 其 中 一 半 指 令 的 CPI 减少 了 一 半 ， 但 是 
处 理 需 的 时 钟 周期 时 间 上 升 了 10%。 这 个 新 实现 与 原先 相 比 快 了 多 少 ? 假设 执行 任何 程序 时 所 有 指 
令 被 执行 的 概率 都 相等 。 

5. 在 一 个 非 流 水 线 的 (多 周期 ) MIPS CPU 中 人 们 在 考虑 对 ALU 的 一 个 改动 。 这 个 改动 会 让 你 可 以 在 一 
个 时 钟 周期 里 完成 算术 运算 并 把 结果 写 入 寄存 器 堆 。 但 是 ， 这 么 做 会 增加 CPU 的 时 钟 周期 时 间 。 具 
体 来 说 ， 原 来 的 CPU 频率 是 500MHz, 但 是 新 设计 的 速度 只 有 400MHz。 这 个 改动 会 提高 还 是 降低 
性 能 ?这 个 新 设计 与 原先 设计 相 比 ， 快 ( 慢 ) 了 多 少 ? 假设 指令 执行 的 频率 如 下 : 


指令 频率 
LW 25% 
SW 15% 
ALU 45% 
BEQ 10% 
JMP 5% 


原始 设计 中 指令 的 CPI 如 下 : 


指令 频率 
LW 5 
SW 4 
ALU 4 
BEW 3 
JMP 3 


6. 以 下 是 不 同类 型 的 指令 的 CPI: 


类 型 CPI 
R 类 2 
I 类 10 
J 类 3 
S 类 4 


相同 程序 的 两 个 不 同 实现 的 指令 频率 如 下 : 
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R 
ry 
Kh 


类 型 实现 1 实现 2 
R 
I 
J 
S 


哪 种 实现 执行 起 来 更 快 ? 为 什么 ? 
7. 静态 和 动态 指令 频率 的 区 别 是 什么 ? 
8. 给 定 以 下 指令 以 及 对 应 的 CPI， 回 答 下 列 问 题 。 


指令 CPI 
ADD 2 
SHIFT 2 
其 他 2 (包括 ADD 和 SHIFT 在 内 的 所 有 
指令 的 平均 值 ) 
ADD/SHIFT 3 


如 果 ADD 紧 跟 着 SHIFT 的 序列 在 程序 中 出 现 的 动态 频率 中 是 20%， 那么 把 所 有 的 ADD, 

SHIFT} 这 个 序列 换 成 新 指令 ADD/SHIFT 的 话 ， 能 使 性 能 提升 百 分 之 多 少 ? 

9. 比较 结构 、 数 据 和 控制 冒险 的 异同 。 怎 么 消除 它们 对 流水 线性 能 可 能 造成 的 负面 影响 ? 

10. 怎么 减轻 或 消除 写 后 读 冒 险 ? 

11. 分 支 目标 缓存 是 什么 ? 它 是 如 何 使 用 的 ? 

12. 为 什么 LC-2200 的 五 阶段 流水 线 里 的 执行 阶段 需要 第 二 个 ALU ? 

13. 在 一 个 如 下 图 所 示 的 五 阶段 流水 线 里 (阶段 之 间 有 缓冲 器 )， 解 释 分 支 指令 带 来 的 问题 ， 并 给 出 解决 
方案 。 


14. 解释 一 下 ， 为 什么 不 管 我 们 用 保守 策略 ， 还 是 用 分 支 预 测 (预测 分 支 未 被 选取 )， 只 要 分 支 被 选取 就 
一 定 会 有 两 个 周期 的 延迟 ( 即 ， 流 水 线 中 塞 进 了 两 个 NOP 指令 )， 然 后 第 5-13.3 中 的 五 阶段 流水 线 
才能 继续 执行 。 

15. 参见 图 5-6a， 找 出 负责 处 理 BEQ 指令 的 数据 通路 元 素 ， 并 解释 它们 的 作用 。 解 释 每 个 时 钟 周 期 里 数 
据 通路 上 分 别 发 生 了 什么 。 假 设 处 理 控制 冒险 采取 的 是 保守 方法 。 你 的 答案 应 该 分 为 两 种 情况 : 分 
支 被 采取 ， 以 及 分 支 未 被 采取 。 

16. 一 个 聪明 的 工程 师 决定 将 五 阶段 流水 线 中 的 两 个 周期 的 “分 支 被 采取 ”的 延迟 降低 为 一 个 周期 。 她 
的 想法 是 直接 用 EX 阶段 计算 出 的 分 支 目标 来 取 指 令 。( 注 意 第 5.13.3 节 中 给 出 的 方法 要 求 目标 地 址 
首先 被 存 进 PC.) 

a. 说 出 对 图 5-6a 要 进行 哪些 修改 来 实现 该 想法 。[ 提示 : 如 果 分 支 被 采取 ， 你 得 同时 将 目标 地 
址 传递 给 PC 和 指令 内 存 。] 
b. 尽管 这 么 做 能 让 流水 线 在 分 支 被 采取 时 的 气泡 数 减少 到 一 个 ， 但 未 必 是 个 好 主意 ， 为 什么 ? 
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[提示 : 考虑 时 钟 周期 时 间 的 影响 。] 
17. 在 茶 流 水 线 处 理 器 里 ， 每 个 指令 都 被 分 成 五 个 阶段 ， 每 个 阶段 需要 花 Ins 时 间 来 执行 。 那 么 最 好 情 
况 下 执行 完 1 000 000 000 条 指令 需要 花 多 久 ? 
18. 用 图 5-6(b) 中 展示 的 五 阶段 流水 线 ， 回 答 下 列 问题 : 
a. 展示 LC-2200 执行 BEQ 指令 时 每 个 阶段 的 行为 (类 似 于 第 5.12.1 节 里 的 内 容 )。 
b. 只 考虑 BEQ 指令 ,计算 FBUF、DBUF、EBUF 和 MBUF 的 尺寸 。 
19. 重复 第 18 题 ， 换 成 SW 指令 。 
20. 重复 第 18 题 ， 换 成 JALR 指令 。 
21. 给 定 下 图 所 示 的 流水 线 处 理 器 的 数据 通路 : 


FBUF DBUF EBUF MBUF 





一 条 加 载 一 个 字 的 指令 有 以 下 32 位 格式 : 
操作 码 寄存 器 A 寄存 器 B 偏 移 量 
8 位 4 位 4 位 16 位 
指令 的 语义 是 
B WFF [A + 偏 移 量 ] 

把 寄存 器 A 的 内 容 加 上 16 位 的 偏 移 量 ， 所 得 到 的 地 址 在 内 存 中 对 应 位 置 所 存储 的 数据 被 赋值 
给 寄存 器 B。 所 有 的 数据 和 地 址 都 是 32 位 量 。 

写 出 为 了 执行 该 指令 ， 流水线 阶段 之 间 的 流水 线 寄存 带 FBUF、DBUF、EBUF 和 MBUF 里 面 
分 别 需要 什么 。 清 楚 地 给 出 每 个 缓冲 器 的 布局 。 标 出 缓冲 需 中 每 个 字段 的 宽度 。 对 于 本 题 你 不 需要 
关心 体系 结构 中 其 他 指令 的 格式 或 者 需求 。 

22. 考虑 以 下 两 条 指令 : 


l: R1 R2 + R3 


如 果 1, 在 流水 线 中 紧 跟 着 TI。 不 用 前 递 的 话 ， 执 行 下 去 需要 插入 几 个 气泡 ( 即 NOP 指令 ) ? 解 

释 你 的 答案 。 
23. 考虑 以 下 程序 片段 : 

假设 这 些 指令 中 没有 冒险 。 现 在 ，IF 阶段 即将 读 取 1004 处 的 指令 。 

a. 说 明 五 阶段 流水 线 的 当前 状态 。 

b. 假设 采用 排 空 策略 来 处 理 中 断 ， 那 么 我 们 进入 INT 宏 状态 需要 之 前 需要 花费 多 少 个 周期 ? 存 
储 进 INT 宏 状 态 的 PC 值 会 是 多 少 ? 

c. 假设 采用 冲刷 策略 来 处 理 中 断 ， 那 么 我 们 进入 INT 宏 状态 需要 之 前 需要 花费 多 少 个 周期 ?人 存 
储 进 INT 宏 状 态 的 PC 值 会 是 多 少 ? 
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6.1 引言 
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如 何 设计 指令 集 、 如 何 用 有 限 状 态 机 来 实现 指令 集 ， 以 及 如 何 用 流水 线 等 技术 来 改进 处 理 器 
的 性 能 。 

Google Earth 的 爱好 者 们 体验 了 从 高 空 观看 一 个 国家 或 者 一 块 大 陆 的 很 酷 的 效果 ， 而 且 如 
果 需 要 的 话 ， 还 可 以 将 他 们 有 兴趣 仔细 探索 的 城市 放大 ， 以 至 于 能 够 看 到 每 条 路 和 每 个 房子 
的 名 字 。 

我 们 刚刚 对 处 理 器 也 做 了 同样 的 事情 。 在 了 解 了 处 理 器 ISA 是 怎么 被 设计 出 来 之 后 ， 我 
们 放大 视图 来 看 看 实现 处 理 器 的 细节 。 我 们 用 LC-2200 指令 集 来 作为 一 个 具体 的 例子 ， 从 硬 
件 的 角度 了 解 了 很 多 细节 。 现 在 让 我 们 再 将 视图 缩小 ， 把 处 理 器 看 作 一 个 黑 盒 子 ， 计 算 机 系 
统 中 一 种 珍 贯 而 稀缺 的 资源 。 几 个 程序 不 得 不 在 该 资源 上 运行 (Google Earth、 电 子 邮件 、 浏 
览 器 、 即 时 通信 ， 等 等 )， 系 统 软件 必须 有 效 管 理 该 资源 ， 以 满足 用 户 的 需要 。 

因此 ， 我 们 把 注意 力 转 移 到 一 个 补充 话题 上 ， 即 如 何 把 处 理 器 作为 计算 机 系统 里 的 一 种 
资源 进行 管理 。 要 做 到 这 一 点 ， 我 们 并 不 需要 了 解 处 理 需 的 内 部 结构 。 这 是 抽象 的 力量 。 把 
处 理 器 看 作 一 个 黑 盒子 ,我们 会 找 出 对 于 管理 这 一 稀缺 资源 有 益 的 软件 抽象 。 操 作 系 统 中 涉 
及 这 一 功能 的 部 分 是 处 理 器 调度 ， 这 也 是 本 章 讨论 的 主题 。 高 效 实 现 该 功能 也 许 需要 回顾 
( 即 “ 放 大 视图 ”) 处 理 右 的 指令 集 ， 以 及 把 指令 集 改进 得 更 聪明 。 我 们 将 会 在 本 章 的 结尾 处 
(参见 6.11 节 ) 回 到 此 问题 。 

考虑 一 个 简单 的 类 比 。 你 有 衣服 要 洗 ， 有 考试 要 准备 ， 你 得 做 晚饭 ， 还 得 给 妈妈 打 电 话 
祝 她 生日 快乐 。 但 是 世界 上 只 有 一 个 你 ， 而 且 你 得 按时 把 这 几 件 事情 都 完成 。 你 会 把 这 些 事 
情 分 出 个 轻重 缓急 ， 但 是 你 还 知道 ， 并 不 是 所 有 这 些 事情 都 需要 一 直 保持 关注 。 比 如 说 ， 你 
让 洗衣 机 开始 洗衣 服 以 后 ， 直 到 它 在 洗 完 衣服 以 后 朝 你 蜂 鸣 为 止 ， 你 都 不 需要 把 注意 力 放 在 
它 上 。 类 似 地 ， 在 我 们 的 微波 炉 文 化 里 ， 做 晚餐 只 需 把 “电视 上 晚 答 ” 塞 进 微波 炉 里 ， 等 它 加 
热 好 了 开始 蜂 鸣 为 止 。 因 此 ， 以 下 是 个 合理 地 把 这 些 都 做 完 的 计划 : 

1) 开始 洗衣 机 的 洗涤 程序 。 

2) 把 食品 塞 进 微波 炉 里 ， 开 始 加 热 。 

3 ) 给 妈妈 打 电 话 。 

4 ) 准备 考试 。 

注意 ， 做 前 两 件 事情 你 只 需要 集中 精力 一 段 很 短 的 时 间 ( 跟 第 3 个 和 第 4 个 任务 相 比 )。 
但 是 ， 有 个 问题 ， 你 不 知道 任务 3 和 任务 4 会 做 多 久 。 比 如 说 ， 给 妈妈 打 电 话 可 能 会 打 很 久 
很 入 。 有 可 能 你 还 在 给 妈妈 打 电 话 ， 洗 衣 机 或 微波 炉 就 朝 你 发 出 蜂 鸣 了 。 好 吧 ， 如 果 洗 衣 机 
朝 你 发 出 蜂 鸣 了 ， 你 可 以 礼貌 地 让 你 妈妈 等 一 小 会 儿 ， 然 后 去 把 洗衣 机 里 面 的 东西 装 到 烘 干 
机 里 ， 然 后 继续 接 电话 。 类 似 地 ， 你 可 以 让 妈妈 等 一 会 儿 ， 去 把 食物 从 微波 炉 里 拿 出 来 ， 放 
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到 饭 果 上 ， 准备 食用 。 当 你 给 妈妈 打 完 电话 ， 你 可 以 安心 享用 晚饭 ， 然 后 开始 准备 考试 。 你 
总 共有 8 个 小 时 用 于 学 习 ， 然 后 你 有 4 门 要 准备 考试 的 课程 。 所 有 考试 对 你 的 最 终 得 分 一 样 
重要 。 在 准备 考试 的 过 程 中 ， 你 需要 做 一 个 抉择 ， 要 么 是 每 门 课 复 习 一 会 儿 ， 循 环 往复 ， 以 
确保 你 在 所 有 课程 上 都 有 所 进展 ， 要 么 是 按照 考试 的 顺序 一 门 一 门 地 学 习 。 

到 这 时 候 ， 也 许 你 会 找 找 涉 ， 问 你 自己 “前 面 讲 了 这 么 多 ， 跟 处 理 器 调度 有 什么 关系 ?” 
当然 你 更 有 可 能 已 经 看 出 这 里 在 发 生 什 么 了 。 你 就 是 那个 稀缺 资源 。 你 在 把 你 的 时 间 划 分 成 
几 份 ， 分 配给 不 同 的 任务 。 你 把 给 妈妈 的 电话 赋予 了 比 准备 考试 更 高 的 优先 级 。 你 随后 会 在 
我 们 讨论 处 理 需 调度 算法 时 看 到 一 个 类 似 优 先 级 的 概念 。 你 给 开始 洗衣 机 的 洗衣 程序 和 微波 
炉 以 与 为 外 两 个 任务 相 比 更 高 的 优先 级 ， 因 为 你 知道 它们 需要 的 时 间 非 常 少 。 你 会 在 最 短 作 
业 优 先 调度 宋 略 看 到 给 予 处 理 硕 的 相似 原则 。 在 你 打 电 话 时 洗衣 机 发 出 了 蜂 鸣 ， 你 会 暂时 让 
妈妈 等 一 会 儿 ， 跑 去 处 理 洗 衣 机 。 之 后 你 会 在 处 理 器 调度 的 上 下 文中 看 到 一 个 类 似 的 概念 ， 
称 作 抢占 。 在 准备 考试 时 ， 你 的 第 一 个 选择 类 似 于 我 们 即将 看 到 的 一 种 被 称 作 循环 调度 的 处 
理 需 调度 策略 ， 而 第 二 种 选择 类 似 于 处 理 需 调度 策略 中 的 先 到 先 服务 策略 。 


6.2 ”程序 和 进程 


让 我 们 以 对 操作 系统 的 简单 理解 开始 对 处 理 器 调度 进行 讨论 。 它 就 是 一 个 程序 ， 它 的 唯 
一 用 途 是 为 执行 用 户 的 程序 提供 资源 。 

为 了 理解 用 户 程 序 需 要 的 资源 ， 让 我 们 首先 回顾 一 下 我 们 是 怎么 创建 程序 的 。 图 6-1 展 
示 了 茶 诸 如 C 语言 一 类 的 高 级 语言 写成 的 程序 的 内 











存 印迹 的 一 种 看 起 来 合理 的 布局 。 di eee 


我 们 用 程序 这 个 词 表 示 很 多 种 含义 。 但 是 ， 通 


程序 全 局 数据 







程序 代码 


常 来 说 我 们 用 这 个 词 来 表示 对 于 特定 问题 的 一 个 计 ae ee 


算 机 解决 方案 。 一 个 程序 也 许 会 以 好 几 种 形式 存在 。 
图 6-2 展示 了 一 个 高 级 语言 程序 创建 的 生命 周 高 端 内 存 | 操作 系统 使 用 
期 。 首 先 ， 我 们 有 一 个 问题 描述 ， 并 根据 它 设 计 了 
一 个 算法 。 我 们 把 算法 以 某 种 编程 语言 (比如 C) 用 图 6-1 内 存 印迹 
一 个 编辑 器 编写 出 来 。 算 法 和 C 代码 是 同一 个 程序 的 不 同 表 现形 式 ， 后 者 是 一 种 把 问题 的 解 
决 方案 代码 化 的 方式 。 编 译 需 将 C 语言 代码 编译 成 程序 的 二 进 制 表示 。 这 个 二 进 制 表示 处 理 
天 仍 然 “ 执 行 ” 不 了 ， 因 为 我 们 写 的 程序 用 到 了 知 干 我 们 认为 理所当然 的 工具 ， 它 们 被 “ 别 
人 ”提供 给 我 们 。 比 如 说 ， 我 们 调用 终端 IO (比如 scanf 和 printf)， 还 调用 数学 运算 (诸如 
正弦 和 余弦 )。 因 此 ， 下 一 步 是 将 我 们 的 代码 与 其 他 人 提供 的 代码 库 链 接 起 来 ， 以 提供 我 们 认 
为 理所当然 的 那些 功能 。 这 就 是 链接 器 的 功能 。 有 链接 器 的 输出 仍然 是 程序 的 二 进 制 表 示 ， 但 
是 现在 它 已 经 处 于 处 理 硕 可 以 执行 的 状态 了 。 程 序 的 不 同 表 现形 式 (文本 、 未 链接 的 二 进 制 ， 
以 及 可 执行 的 二 进 制 ) 最 终 会 进入 你 的 硬盘 。 加 载 器 ， 通 常 是 操作 系统 的 一 部 分 ， 它 负责 读 
取 人 硬盘 上 的 内 容 ， 并 创建 图 6-1 所 示 的 内 存 印迹 。 
编辑 器 、 编 译 吉 和 链接 需 都 是 独立 的 程序 ， 而 加 载 需 则 是 一 个 更 大 的 程序 的 一 部 分 ， 这 
个 更 大 的 程序 即 操作 系统 。 任 何 程序 都 需要 资源 来 执行 。 这 里 说 的 资源 就 是 处 理 器 、 内 存 和 
任何 输入 /输出 设备 。 假 设 你 要 写 一 个 简单 的 “Hello, world” 程 序 。 让 我 们 来 列举 一 下 运行 


O 在 生成 可 执行 文件 的 过 程 中 ,链接 的 步骤 通常 是 编译 右 的 一 部 分 。 
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这 个 简单 程序 所 需要 的 资源 : 你 当然 需要 处 理 器 和 内 存 ; 此 外 ， 你 需要 显示 器 来 显示 你 的 输 
出 。 操 作 系 统 负 责 把 程序 所 需要 的 资源 交 给 它 。 

在 迄今 为 止 的 讨论 中 ， 不 难看 出 ， 操 作 系统 和 其 他 任何 程序 一 样 ， 也 需要 常 驻 内 存 中 ， 
有 着 类 似 于 其 他 任何 程序 的 内 存 印 迹 。 图 6-3 展示 了 用 户 程序 和 操作 系统 的 内 存 内 容 。 


问题 描述 


Maat 





图 6-2 创建 程序 的 生命 周期 图 6-3” 内存 中 的 操作 系统 和 用 户 内 存 


在 本 章 中 ， 我 们 将 主要 关注 操作 系统 负责 分 配 处 理 器 资源 给 程序 的 部 分 ， 这 部 分 被 称 作 
调度 器 。 

调度 器 是 操作 系统 中 的 一 组 例 程 ， 如 其 他 程序 一 样 ， 调 度 器 也 需要 用 处 理 器 来 工作 一 一 
即 选择 在 处 理 器 上 运行 哪个 程序 。 调 度 器 包含 一 个 决定 一 组 程序 中 谁 会 赢得 处 理 器 时 钟 周 期 
的 算法 。 

你 已 经 听 说 过 进程 一 词 。 让 我 们 来 理解 进程 是 什么 ， 它 跟 程 序 有 什么 不 同 。 进 程 是 执行 中 
的 程序 。 参 考 图 6-1， 我 们 把 进程 的 地 址 空间 定义 为 这 个 程序 在 内 存 中 占用 的 空间 。 程 序 开始 
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在 处 理 融 上 运行 之 后 ， 程 序 占用 的 内 存 空 间 中 的 内 容 可 能 会 由 于 程序 对 数据 结构 的 操作 而 改变 。 
此 外 ， 程 序 还 能 在 执行 中 使 用 处 理 需 寄存 器 。 地 址 空间 的 当前 内 容 加 上 寄存 器 的 值 ， 就 构成 了 
程序 执行 的 状态 〈 即 进程 的 状态 )。 我 们 随后 会 看 到 如 何 具体 地 表示 一 个 进程 的 状态 。 

进程 第 常 是 处 理 右 调度 的 单位 。 调 度 絮 的 输入 是 一 组 准备 好 在 处 理 器 上 运行 的 进程 ， 以 
及 儿 助 调度 希 在 这 些 进 程 中 选择 一 个 胜利 者 的 其 他 属性 ， 人 参见 图 6-4。 这 些 属性 允许 调度 器 在 
进程 之 间 实 现 某 种 优先 级 。 例 如 ， 期 望 运行 时 间 、 期 望 内 存 使 用 和 期 望 IO 需求 是 与 程序 相 
关 的 静态 属性 。 类 似 地 ， 可 用 系统 内 存 、 程 序 到 达 时 间 和 程序 瞬时 内 存 需求 则 是 调度 器 可 能 
用 到 的 动态 属性 。 紧 迫 性 〈 可 以 表达 为 截止 时 间 /或 重要 性 ) 可 能 是 调度 器 可 以 用 到 的 另 一 类 
附加 属性 。 有 一 些 属性 (诸如 紧迫 性 ) 是 显 式 地 告诉 调度 希 的 ， 而 另 一 些 则 是 调度 器 可 以 隐 式 
地 推断 出 来 的 (诸如 到达 时 间 )。 





图 6-4 ”调度 右 一 一 一 个 以 当前 可 以 运行 的 进程 集合 作为 输入 ,根据 系统 状态 和 程序 属性 
选择 一 个 胜利 者 在 处 理 侨 上 运行 


诸如 任务 和 线程 这 样 的 词 经 常 被 用 来 表示 工作 的 单位 或 调度 的 单元 。 我 们 会 警告 读者 ， 
虽然 进程 的 定义 在 不 同 书 里 意思 都 一 样 ， 但 是 任务 和 线程 就 难说 了 。 在 大 部 分 书 里 ,任务 的 
含义 与 进程 一 样 。 在 本 章 中 ， 我 们 只 用 任务 一 词 表示 工作 单位 。 我 们 将 会 给 出 线程 的 一 个 基 
本 定义 ， 它 对 我 们 理解 调度 算法 很 有 用 处 。 

这 里 做 个 类 比 会 很 有 用 ， 如 图 6-5a ~ 所 示 。 你 取 了 晨报 。 它 现在 躺 在 餐桌 上 ， 没 有 人 
在 读 它 ， 就 像 在 内 存 中 休眠 的 进程 一 样 。 你 把 它 拿 起 来 开始 读 。 

现在 有 一 个 活动 的 实体 在 读 报 了 ， 就 是 你 。 注 意 ， 根 据 你 的 兴趣 ， 你 会 读 报纸 的 不 同 部 
分 。 进 程 也 是 如 此 。 取 决 于 输入 和 程序 的 逻辑 ， 进 程 可 能 会 沿 着 程序 的 特定 路 径 执 行 。 这 条 
路 径 为 进程 定义 了 一 个 控制 线程 。 让 我 们 回 到 读 报 纸 的 类 比 ， 来 看 看 为 什么 在 进程 中 有 多 个 
控制 线程 是 有 意义 的 。 现 在 想象 一 下 ,在 你 读 报纸 的 时 候 你 的 姐姐 也 来 早餐 果 前 ， 和 你 一 起 
看 报纸 ， 如 图 6-5c 所 示 。 取 决 于 她 的 兴趣 ， 也 许 她 会 读 报纸 的 另 一 部 分 。 现 在 有 两 个 活动 了 
(你 和 你 姐姐 )， 或 者 说 有 两 个 控制 线程 ， 在 浏览 晨报 。 类 似 地 ， 一 个 进程 中 可 以 有 多 个 控制 线 
程 。 我 们 会 详细 说 明 为 什么 一 个 进程 里 中 有 多 个 线程 是 个 好 主意 ， 还 会 在 随后 讨论 多 处 理 需 
和 多 线程 程序 的 时 候 说 明 线程 和 进程 的 具体 差异 。 现 在 ， 只 需 把 线程 理解 为 进程 中 的 执行 单 
元 (也 许 还 是 调度 的 单元 ) 就 足够 了 。 一 个 进程 中 的 所 有 线程 在 同一 个 地 址 空间 中 执行 ， 共 享 
程序 的 内 存 印 迹 (图 6-1) 中 所 展示 的 代码 和 数据 结构 。 换 和 句 话说， 进程 就 是 程序 加 上 所 有 在 
该 程序 中 执行 的 线程 。 这 类 似 于 把 报纸 和 你 姐姐 和 你 加 在 一 起 。 

一 个 进程 里 可 以 有 多 个 线程 ， 但 是 从 本 章 中 所 讨论 的 调度 算法 的 角度 来 说 ， 每 个 进程 只 
有 一 个 控制 线程 。 关 于 调度 的 文献 用 作业 来 表示 调度 的 单位 ， 为 了 与 此 保持 一 致 ， 我 们 决定 
在 本 章 中 把 作业 作为 进程 的 同义词 。 我 们 把 这 些 术 语 及 其 含义 总 结 在 表 6-1 中 。 
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图 6-5 你 和 你 的 姐姐 在 看 报纸 


表 6-1 作业、 进程、 线程 和 任务 


名 称 在 本 章 中 的 使 用 方式 
作业 与 进程 同 义 
进程 与 作业 同 义 
线程 在 本 章 的 调度 算法 中 未 使 用 


任务 作业 单位 ; 调度 单元 在 本 章 中 的 调度 算法 中 未 使 用 ， 除 了 描述 Linux 的 调度 算法 以 外 


6.3 调度 环境 


一 般 来 说 ， 处 理 器 可 能 会 用 来 做 一 组 特定 的 任务 。 以 手机 之 类 的 般 入 式 设备 的 处 理 器 为 
例 来 说 ， 可 能 会 有 一 个 任务 是 负责 啊 铃 ， 一 个 任务 是 负责 拨打 电话 ， 等 等 。 在 这 种 专用 环境 
里 ,调度 器 可 以 简单 地 循环 检查 有 没有 可 以 执行 的 任务 。 

在 大 型 面向 批 处 理 的 计算 的 年 代 (跨越 了 20 世纪 60 年 代 、20 世纪 70 年 代 和 20 世纪 80 
年 代 早 期 )， 调 度 环境 是 多 程序 的 ， 即 多 个 程序 从 磁盘 里 读 取 到 内 存 上 ， 操 作 系 统 根据 它们 的 
相对 优先 级 循环 执行 它们 。 那 时 候 ， 你 得 把 程序 的 描述 (在 一 张 磁盘 上 ) 以 及 以 一 种 被 称 为 作 
业 控 制 语言 (JCL，Job Control Language) 的 语言 写成 的 它 的 执行 需求 交 给 一 个 人 类 操作 员 。 
一 般 来 说 你 会 几 个 小 时 以 后 再 回来 拿 你 的 输出 。 在 数据 终端 和 小 型 机 到 来 以 后 ， 交 互 式 ， 或 
者 说 分 时 的 环境 就 变 得 切实 可 行 。 这 种 情况 下 ， 处 理 需 时 间 被 坐 在 终端 前 使 用 计算 机 的 用 户 
所 共享 。 值 得 一 提 的 是 ， 分 时 环境 一 定 是 多 程序 的 ， 但 是 多 程序 的 环境 未 必 是 分 时 的 。 这 些 
不 同 的 环境 也 产生 了 不 同类 型 的 调度 器 (参见 图 6-6 ) 。 

高 级 调度 器 (long-term scheduler) 通常 用 于 面 回 批 处 理 的 多 程序 环境 里 ， 均 衡 内 存 中 的 
作业 以 优化 系统 资源 (处 理 器 、 内 存 、 硬 盘 等 ) 的 使 用 。 随 着 个 人 计算 机 和 分 时 环境 的 到 来 ， 
高 级 调度 器 对 于 所 有 实际 的 用 途 来 说 ， 在 绝 大 多 数 现代 操作 系统 中 根本 不 存在 。 取 而 代 之 的 
是 操作 系统 中 一 个 叫做 加 载 器 的 组 件 ， 在 用 户 开 始 运行 一 个 存储 在 磁盘 上 的 程序 ( 即 ， 在 笔 
记 本 电脑 上 点 击 图 标 ， 或 者 是 在 命令 行 下 敲 入 程序 名 ) 后 创建 内 存 足 迹 。 高 级 调度 右 (或 者 加 
载 器 ) 负责 根据 驻 留 在 磁盘 上 的 用 户 程序 (u) 创建 驻 留 在 内 存 的 进程 (p;)。 

中 级 调度 器 (medium-term scheduler) 则 在 包括 现代 操作 系统 在 内 的 很 多 环境 里 用 到 ， 它 
们 紧 紧 跟踪 当前 正在 CPU 上 执行 的 进程 的 动态 内 存 占用 量 ， 以 决定 是 否 要 增加 或 减少 多 道 程 
序 度 ， 多 道 程序 度 的 定义 是 同时 在 内 存 中 存在 并 且 竞 争 CPU 的 进程 个 数 。 该 调度 器 主要 负责 
控制 一 种 被 称 作 颠 签 的 现象 ， 即 当前 的 进程 集合 的 内 存 需求 超出 了 系统 容量 ,导致 进程 在 各 
自 的 执行 中 进展 缓慢 。 中 级 调度 器 在 系统 吞吐 量 下降 时 ， 把 程序 在 磁盘 (在 图 6-6 中 以 交换 空 
间 的 形式 展现 ) 和 内 存 之 间 来 回 移动 。 我 们 将 会 在 第 8 章 中 更 详细 地 回 到 颠 艇 这 个 概念 上 。 

低级 调度 器 (short-term scheduler) 也 在 大 部 分 现代 操作 系统 中 出 现 ， 首 次 出 现 是 在 分 时 
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操作 系统 中 。 调 度 融 负责 在 当前 驻 留 在 内 存 中 的 进程 中 选择 一 个 来 运行 。 本 章 的 重点 ， 包 括 

介绍 的 算法 在 内 ， 主 要 关注 的 都 是 低级 调度 器 。 最 后 一 个 东西 是 分 发 器 ， 负 责 给 低级 调度 器 
小 幸 的 进程 设置 好 处 理 器 寄存 器 的 值 以 让 系统 准备 好 执行 该 进程 。 高 级 调度 器、 中 级 调度 
和 化、 低级 调度 如 和 分 发 硕 都 是 操作 系统 的 组 件 ， 并 且 它 们 互相 协调 各 自 的 行为 。 









高 级 调 
= iE tir 


中 级 调 
度 器 


图 6-6 调度 大 的 类 型 (ui 表示 磁盘 上 的 用 户 程序 ; pi 表示 内 存 里 的 用 户 进程 ) 


K 6-2 总 结 了 不 同 环境 里 不 同类 型 的 调度 需 以 及 它们 分 别 的 作用 。 
表 6-2 调度 器 类 型 和 作用 


名 称 | 作用 
高 级 调度 器 |， 面向 批 处 理 的 操作 系统 控制 内 存 中 的 程序 集合 ， 以 平衡 系统 资源 的 利用 
EE 所 有 操作 系统 将 用 户 程序 从 硬盘 加 载 到 内 存 





中 级 调度 器 所 有 现代 操作 系统 (分 时 的 、 交 互 式 的 ) 平衡 内 存 中 的 进程 集合 ， 以 避免 颠 艇 
低级 调度 器 所 有 现代 操作 系统 (分 时 的 、 交 互 式 的 ) 调度 内 存 中 的 进程 在 CPU 上 执行 


分 发 器 所 有 操作 系统 把 低级 调度 器 选中 的 进程 的 处 理 器 状态 装 进 
CPU 寄存 器 里 


6.4 调度 基础 


在 继续 深究 调度 器 之 前 先 理解 程序 行为 是 很 有 用 的 。 想 象 你 的 计算 机 上 的 一 个 从 CD 播 
放 器 播放 音乐 的 程序 。 程 序 反 复 从 CD 盘 中 读 取 音 轨 (IO 活动 )， 然 后 把 读 到 的 音 轨 处 理 (处 
理 器 活动 ) 后 传 给 扬声器 。 我 们 发 现 ， 这 就 是 程序 的 典型 行为 一 一 在 处 理 需 上 的 突 发 性 活动 
和 IO 设备 上 的 突 发 性 活动 之 间 循 环 往复 (参见 图 6-7 )。 
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时 间 轴 
图 6-7 在 CD 播放 器 上 播放 音乐 


我 们 将 采用 CPU 究 发 这 个 术语 来 表示 进程 在 不 进行 IO 调用 的 情况 下 所 运行 的 一 段 时 
间 。 不 正式 地 说 ， 我 们 把 一 个 进程 的 CPU 突 发 定义 为 在 进行 VO 调用 之 前 所 连续 进行 CPU 
活动 的 时 间 区 间 。 根 据 本 章 开 始 时 的 类 比 ，CPU 突 发 就 类 似 于 你 为 了 准备 考试 而 连续 阅读 直 
到 去 冰箱 里 拿 汽水 的 连续 时 间 区 间 。 类 似 地 ， 我们 采用 术语 VO 突 发 来 表示 一 个 进程 用 于 处 
H IO 操作 ( 壁 如 说 ， 从 CD 中 读 取 音乐 文件 ) 的 一 段 连续 的 时 间 。 值 得 一 提 的 是 在 IO 突 发 
中 进程 并 不 会 用 到 处 理 器 。 在 第 4 章 中 我 们 介绍 了 中 断 的 概念 ， 以 及 中 断 是 怎么 让 处 理 天 把 
注意 力 转移 到 诸如 IO 完成 一 类 的 外 界 事件 上 的 。 在 第 10 章 中 ， 我 们 将 会 讨论 VO 设备 和 处 
理 器 之 间 的 实际 数据 传输 机 制 。 而 现在 ， 为 了 让 处 理 器 调度 的 讨论 尽量 简单 ， 我 们 不 妨 假设 ， 
进程 在 遇 到 IO 请 求 的 时 候 就 不 再 争夺 CPU 资源 ， 直 到 LO 完成 为 止 。 

处 理 器 调度 器 被 划分 为 两 个 大 类 : 非 抢 占 式 和 抢占 式 。 在 非 抢占 式 调 度 锅 里 ， 一 个 进程 
要 不 然 就 一 直 执 行 到 底 ， 要 不 然 就 自己 主动 自愿 地 放弃 处 理 器 ， 以 处 理 1/O 请 求 。 男 一 方面 ， 
在 抢占 式 调 度 器 里 ， 调 度 器 从 当前 进程 手 里 把 处 理 需 抢 走 ， 交 给 另 一 个 进程 。 不 管 是 哪 一 种 ， 
调度 的 步骤 均 如 下 : 

1 ) 获得 处 理 右 的 控制 权 。 

2) 把 当前 正在 运行 的 进程 的 状态 保存 下 来 。 

3 ) 选择 一 个 新 的 进程 来 运行 。 

4 ) 把 新 选择 的 进程 分 发 到 处 理 融 上 运行 。 

最 后 一 步 ， 分 发 ， 是 指 把 选 定 进程 之 前 保存 下 来 的 状态 加 载 到 处 理 需 寄存 需 的 过 程 。 

让 我 们 来 理解 正在 运行 的 程序 ， 或 者 说 是 进程 ， 它 的 状态 是 指 什么 。 它 包括 程序 执行 到 
了 什么 地 方 (PC 值 )， 处 理 器 寄存 器 的 内 容 是 什么 (假设 这 些 寄存 器 中 有 一 个 就 是 栈 指针 )， 
以 及 程序 在 内 存 中 的 印迹 在 哪里 。 除 此 以 外 ， 进 程 本 身 也 许 是 刚刚 被 加 载 进 内 存 等 待 运行 ， 
或 者 是 等 待 1O ， 或 者 是 正在 运行 ， 或 者 出 于 某 种 原因 中 止 了 执行 ， 或 者 处 于 其 他 的 什么 状 
态 中 。 

除 此 以 外 ， 调 度 器 可 能 还 了 解 进程 的 一 些 属 性 (内 在 的 或 者 外 来 的 )， 比 如 进程 优先 级 、 
程序 的 到 达 时 间 ， 以 及 期 望 的 运行 时 间 。 所 有 的 状态 信息 都 被 聚集 在 一 个 数据 结构 中 ， 称 作 
PCB (进程 控制 块 ，Process Control Block)， 如 图 6-8 所 示 。 每 个 进程 都 有 一 个 PCB DAE aS 
则 将 所 有 PCB 维护 在 一 个 链表 中 ， 该 链表 被 称 作 就 结 队列 ， 如 图 6-9 所 示 。 
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enum state type {new, ready, running, waiting, halted}; 


typedef struct control block type { 
enum state type state; 当前 状态 */ 
address PC; 从 哪里 继续 x / 
int reg_file[NUMREGS]; 通用 寄存 器 的 内 容 */ 
struct control block *next_pcb; 链表 指针 */ 
int priority; 外 来 属性 */ 
address address space; 内 存 位 置 */ 





} control block; 


图 6-8 ”进程 控制 块 (PCB) 


图 6-9 PCB 的 就 绪 队 列 。PCB 保存 了 所 有 关于 进程 的 信息 ， 就 绪 队 列 通 常 则 是 个 PCB 
的 链表 


PCB 包含 了 所 有 必需 的 描述 进程 的 信息 。 它 是 操作 系统 的 关键 数据 结构 。 我 们 将 会 在 之 
后 讨论 内 存 系统 和 网 络 的 章节 中 看 到 ，PCB 是 与 进程 相关 的 所 有 状态 信息 (如 占用 的 内 存 、 
打开 的 文件 以 及 网 络 连接 ) 的 聚合 。 就 绪 队 列 是 调度 器 中 最 重要 的 数据 结构 。 该 数据 结构 的 
有 效 表示 和 操作 是 调度 器 性 能 的 关键 。 调 度 器 的 职责 是 快速 地 进行 调度 决策 ， 然 后 离开 ,让 
CPU 尽量 用 来 运行 用 户 程 序 。 因 此 ， 一 个 关键 问题 是 找 出 恰当 的 用 来 衡量 调度 算法 的 效率 的 
标准 。 直 观 地 说 ， 我 们 希望 花 在 调度 器 里 的 时 间 占 总 CPU 时 间 的 百分比 很 小 。 我 们 将 会 在 一 
个 案例 研究 ( 见 第 6.12 节 ) 中 看 到 ，Linux 调度 器 是 如 何 组 织 它 的 数据 结构 以 确保 高 效 的 。 

注意 在 处 理 器 状态 中 并 不 包含 CPU 数据 通路 的 内 部 寄存 胡 (参见 第 3 章 和 第 5 章 )。 原 
因 将 会 在 本 小 节 的 结尾 处 揭晓 。 

类 似 于 进程 控制 块 的 就 绪 队 列 ， 等 待 IO 的 进程 的 PCB 队列 也 旧 操 作 系 统 维护 (参见 


图 6-10 )。 
PCB, PCB, oo PCB,, 


图 6-10 PCB 的 IO 队列 。 在 一 个 进程 产生 阻塞 式 VO 请 求 时 ， 相 应 进程 的 PCB 被 移 到 
IO RM, SR VO 完成 


出 于 本 次 讨论 的 目的 ，PCB 在 就 绪 队 列 和 IO 队列 之 间 来 回 移 动 ， 取 决 于 对 应 的 进程 是 
需要 处 理 器 还 是 VO 服务 。CPU 调度 器 用 就 绪 队 列 来 调度 用 到 处 理 需 的 进程 。 我 们 在 本 章 中 
讨论 的 每 个 调度 算法 都 假设 存在 这 么 一 个 就 绪 队 列 。 就 绪 队 列 中 的 PCB 的 组 织 则 取决 于 具体 
的 调度 算法 。PCB 数据 结构 简化 了 我 们 在 本 节 中 之 前 的 部 分 所 提 到 的 调度 所 用 到 的 步骤 。 调 
度 器 知道 哪个 PCB 对 应 于 哪个 正在 运行 的 进程 。 把 状态 保存 起 来 的 步骤 就 是 拷贝 相关 信息 
(在 图 6-8 中 列 出 ) 到 当前 运行 的 进程 的 PCB 中 的 过 程 。 类 似 地 ， 调 度 右 选择 一 个 进程 作为 下 
一 个 运行 在 处 理 器 上 的 候选 者 之 后 ， 把 它 分 发 到 处 理 吉 上 也 就 是 简单 地 把 处 理 需 寄存 硕 效 上 
选 定 进程 的 PCB 里 所 包含 的 信息 。 

从 第 4 竟 我 们 了 解 到 了 系统 调用 (比如 IO 操作 ) 和 中 断 都 是 不 同类 型 的 程序 不 连续 性 。 
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便 件 对 所 有 程序 不 连续 性 的 处 理 都 是 类 似 的 ， 即 等 待 处 理 器 到 达 一 个 干净 的 状态 ， 然 后 处 理 
该 不 连续 性 。 一 条 指令 执行 完毕 就 是 这 里 所 说 的 干净 的 状态 。 处 理 器 一 旦 达到 这 样 的 干净 状 
AS, MEERA A TBA are ak ( 即 程序 员 看 不 到 的 那些 ) 也 就 不 包含 任何 与 当前 程序 相干 的 信息 。 
因为 调度 各 从 一 个 进程 切换 到 男 一 个 进程 的 时 机 是 明确 定义 的 程序 不 连续 性 ， 便 没有 必要 把 
程序 员 在 指令 集中 看 不 到 的 处 理 需 内 部 寄存 天 (在 第 3 章 和 第 5 章 中 讨论 过 ) 保存 下 来 。 

表 6-3 总 结 了 调度 算法 中 重要 的 术语 。 


表 6-3 调度 术语 


CPU 突 发 在 请 求 VO 操作 之 前 进程 进行 的 连续 CPU 活动 

IO 突 发 CPU 在 LO 设备 上 发 起 的 活动 

PCB 进程 控制 块 ， 保 存 进程 ( 即 运行 中 的 程序 ) 的 状态 

就 绪 队 列 PCB 队列 ， 由 表示 准备 好 在 CPU 上 运行 的 驻 留 在 内 存 里 的 进程 的 PCB 组 成 

IO 队列 PCB 队列 ， 由 表示 正在 等 待 发 起 IO 操作 或 者 等 竺 结束 IO 操作 的 驻 留 在 内 存 里 的 进程 的 
PCB 组 成 

非 抢 占 式 算法 允许 当前 调度 在 CPU 上 的 进程 自愿 让 出 处 理 器 (通过 结束 执行 ， 或 者 进行 VO 系统 调用 ) 的 
算法 

抢占 式 算 法 在 发 生 外 部 事件 (比如 IO 完成 中 断 ， 或 者 定时 器 中 断 ) 时 会 从 当前 调度 的 进程 中 强行 抢 走 
处 理 器 的 算法 

FARE 在 就 绪 队 列 中 的 进程 的 动态 内 存 使 用 超过 了 系统 总 内 存 容 量 时 发 生 的 一 种 现象 


6.5 性 能 指标 


在 讨论 调度 算法 时 ， 我 们 认为 术语 作业 和 进程 是 同义词 。 作 为 操作 系统 的 一 部 分 ， 调 度 
器 也 是 程序 ， 也 需要 在 处 理 器 上 运行 。 调 度 器 的 最 终 的 目标 是 运行 用 户 程序 。 因 此 ， 运 行 用 
户 程序 时 处 理 器 在 被 合理 利用 ， 而 在 运行 操作 系统 本 身 的 时 候 就 没有 得 到 利用 。 这 里 就 产生 
了 问题 ， 即 评价 调度 算法 的 效率 的 指标 是 什么 ? CPU 利用 率 是 指 处 理 带 繁忙 时 间 的 百分比 。 
尽管 这 个 百分比 是 个 有 用 的 指标 ， 但 它 并 没有 说 明 处 理 器 到 底 在 做 什么 。 所 以 ， 让 我 们 看 看 
有 没有 其 他 指标 。 指 标 既 可 以 是 以 用 户 为 中 心 的 也 可 以 是 以 系统 为 中 心 的 。 吞 吐 量 是 个 以 系 
统 为 中 心 的 指标 ， 表 示 每 单位 时 间 内 所 完成 的 作业 个 数 。 平 均 周 转 时 间 是 另 一 个 以 系统 为 中 
心 的 指标 ， 用 于 测量 作业 进入 和 离开 系统 平均 所 花 的 时 间 。 平 均等 待 时 间 是 男 一 个 以 系统 为 
中 心 的 指标 。 作 业 的 响应 时 间 则 是 以 用 户 为 中 心 的 指标 ,测量 给 定 作 业 的 经 过 时 间 。 

图 6-11 显示 了 在 处 理 器 上 调度 三 个 进程 P1 、P2 和 P3 的 时 间 轴 。 假 设 所 有 进程 都 在 时 刻 0 FF 
始 。 为 了 本 次 讨论 方便 ,我 们 假设 在 阴影 部 分 里 处 理 器 忙 着 做 别 的 事情 ， 与 运行 这 些 进 程 无 关 。 


e1 e2 


Wy e3 


W3 


eng 一 
w.e, t 分 别 是 作业 j 的 等 待 时 间 ， 执 行 时 间 和 经 过 时 间 。 
图 6-11 调度 三 个 进程 P1，P2 和 P3 的 时 间 轴 
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参照 图 6-11， 我 们 将 刚刚 定义 的 术语 量化 如 下 : 
RE = 3/t, 作业 / 秒 
平均 周转 时 间 =(ti 二 十 tb)/3 £ 
平均 等 待 时 间 = ((t,—e,) + (t —e,) + (t, —e3)) / 3 £ 
推广 到 个 作业 ， 我 们 得 到 | | 
B+ ew =n/T 作业 / 秒 ， 其 中 TT 是 这 个 作业 完成 的 总 经 过 时 间 
平均 周转 时 间 =(t+b+.+t)7 n & 
平均 等 待 时 间 = (w, tw, t+... + w,)/n $ 
啊 应 时 间 就 是 每 进程 的 周转 时 间 ， 因 此 ， 有 下 列 等 式 : 
Be, = tl 
R= 12 
Rs. = 


Rp, = tn 
响应 时 间 的 方差 5s 也 是 个 有 用 的 指标 。 除 了 以 上 定量 指标 以 外 ， 还 应 当 提 一 下 关于 调度 算 
法 的 两 个 定性 指标 : 

。 饥 饿 ”在 任何 作业 组 合 中 ， 调 度 策略 都 应 该 确保 所 有 的 作业 一 直 有 进展 。 如 果 出 于 某 
种 原因 ， 一 个 作业 并 没有 任何 进展 ， 我 们 就 把 这 种 情况 称 作 饥 狐 。 这 种 情况 的 定量 表 
现 是 特定 作业 的 响应 时 间 没 有 上 界 。 

。 护送 效应 ”在 任何 作业 组 合 中 ， 调 度 策 略 应 当 努 力 预防 长 时 间 运 行 的 作业 完全 占据 
CPU 的 使 用 。 如 果 出 于 某 种 原因 ， 作 业 的 调度 符合 固定 的 规律 〈 类 似 于 军队 中 的 护卫 )， 
我 们 就 把 这 种 情况 称 作 护送 效应 。 这 个 现象 的 定量 表现 是 作业 的 响应 时 间 的 方差 很 大 。 

我 们 将 会 在 随后 几 节 中 讨论 知 干 调度 算法 。 在 如 此 做 之 前 ， 请 先 注 意 以 下 几 点 : 

。 在 所 有 调度 算法 中 ,我 们 假设 从 一 个 进程 切换 到 另 一 个 进程 的 时 间 可 以 忽略 不 计 ， 以 
简化 调度 的 时 序 图 。 

。 我 们 提 到 过 ， 进 程 可 能 会 在 生命 周期 中 ,在 CPU 和 IO 请 求 之 间 来 回 切换 。 自 然 地 ，L/ 
O 请 求 在 不 同时 间 可 能 是 关于 不 同 设 备 的 (输出 到 屏幕 、 从 磁盘 读 取 、 从 鼠标 输入 ， 等 
等 )。 但 是 ， 由 于 本 章 的 重点 是 CPU 调度 ， 为 了 简便 起 见 我 们 只 画 出 一 个 IO 队列 。 

。 还 是 为 了 把 重点 放 在 CPU 调度 上 ， 我 们 假设 调度 1/O 请 求 采 用 一 种 简单 的 模型 ( 先 到 
先 服务 )。 换 句 话 说，CPU 调度 器 在 调度 进程 时 使 用 的 内 在 或 者 外 来 属性 并 不 适用 于 I/ 
O WE, VO 请 求 就 按照 它们 被 进程 请 求 的 顺序 处 理 。 

表 6-4 总 结 了 从 调度 的 角度 来 说 有 意义 的 性 能 指标 。 


表 6-4 ”性 能 指标 小 结 


名 和 a ae a fd 
CPU 利用 率 CPU arta 
oe | | 


日 ”响应 时 间 的 方差 是 可 能 的 响应 时 间 离 期 望 值 的 差 的 平方 的 平均 数 。 
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( 续 ) 
名 称 描述 


平均 等 待 时 间 (Wave) | ((ty-e,)+(t.-€,)+...4+(t,-€,))/n i 表示 作业 经 历 的 平均 等 待 


响应 时 间 / 周转 时 间 TT ETE 表示 特定 作业 1 的 周转 时 
啊 应 时 间 方 差 E[(t—-e,)"] 用 户 中 心 指 标 ， 表 示 给 定 进 程 的 实际 啊 应 
时 间 与 其 期 望 值 的 统计 差异 


JR | 用 户 中 心 的 定性 指标 ， 表 示 特 定 的 一 个 或 





si 
护送 效应 


a 表示 由 于 调度 需 的 
某 种 内 在 特性 而 对 某 些 进程 产生 任 面 效果 


6.6 非 抢 占 式 调度 算法 


我 们 之 前 已 经 提 到 过 ， 非 抢占 式 算 法 中 ， 在 当前 进程 被 调度 到 CPU 上 运行 之 后 ， 调 度 需 
就 不 控制 当前 进程 了 。 只 有 在 当前 进程 通过 终止 或 者 发 出 阻塞 式 系统 调用 (比如 文件 IO 请 
求 ) 时 调度 器 才能 取 回 控制 权 。 在 本 节 中 ， 我 们 将 会 考虑 属于 此 类 的 3 种 不 同 算法 : FCFS, 
SJF， 以 及 优先 级 调度 。 


6.6.1 先 到 先 服务 


本 算法 中 用 到 的 内 在 属性 是 进程 的 到 达 时 间 ， 即 运行 一 个 应 用 程序 的 时 间 。 例 如 ， 如 果 
你 在 t 时 间 运 行 winamp， 之 后 在 t 时 间 运 行 realplayer， 那 么 winamp 的 到 达 时 间 对 于 调度 器 
来 说 就 较 早 。 因 此 ， 在 两 个 程序 的 整个 生命 周期 中 ， 只 要 两 个 程序 都 可 以 运行 ，winamp 一 定 
会 被 调度 器 选中 执行 ， 因 为 它 的 到 达 时 间 比 较 早 。 记 住 ， 这 个 winamp 的 “优先 权 ” 甚 至 在 它 
从 W/O 完成 之 后 返回 就 绪 队 列 时 也 会 持续 起 作用 。 例 6-1 展示 了 先 到 达 的 进程 与 就 绪 队 列 里 其 
他 进程 相 比 所 享受 的 优势 。 

图 6-12 展示 了 一 组 进程 ， 并 在 图 的 上 半 部 分 画 出 了 它们 的 活动 。 每 个 进程 的 活动 都 在 
CPU 突 发 和 I/O 突 发 之 间 交 苦 。 例 如 说 ，P2 进行 1 个 单位 的 运算 ， 然 后 2 个 单位 的 IO， 并 
在 整个 生命 周期 里 一 直 重 复 下 去 。 图 6-12 的 下 半 部 分 给 出 了 对 这 些 进 程 在 CPU 和 IO 上 进行 
先 到 先 服务 (FCFS, First-Come First-Served) 调度 的 时 间 轴 。 在 任何 时 间 ， 有 恰好 一 个 进程 
在 CPU 上 执行 ， 另 一 个 在 进行 IO 活动 。 假 设 每 个 进程 需要 处 理 两 个 CPU 突 发 ， 中 间 穿 插 
一 次 IO 突 发 。 所 有 3 个 进程 在 时 间 轴 的 开始 处 均 准 备 好 运行 。 但 是 ，P1 是 第 一 个 达到 的 ， 
然后 再 是 P2 和 了 P3。 因 此 ， 在 可 以 选择 的 时 候 ， 由 于 先 到 先 服务 原则 ， 调 度 需 总 是 会 优先 选 
然后 是 P2 和 P3。P1、P2 Al P3 的 等 待 时 间 分 别 是 0、27 和 26。 

个 算法 有 个 很 好 的 性 质 ， 即 任何 进程 都 不 会 饥饿 一 一 也 就 是 说 ， 算 法 中 没有 会 导致 任 
Mida 我 们 随后 会 看 到 ， 并 不 是 所 有 算法 都 具有 此 性 质 。 但 是 ， 由 于 
该 属性 的 本 质 ， 响 应 时 间 的 方差 可 能 会 很 大 。 例 如 ， 如 果 在 一 个 长 作业 到 达 之 后 紧 接着 来 了 
一 个 短 作 业 ， 则 短 作 业 的 响应 时 间 就 会 很 糟糕 。 该 算法 也 由 于 图 6-12 中 描绘 的 护送 效应 而 寻 
致 低下 的 处 理 器 利用 率 。 术 语 护 送 效应 (convoy effect) 主要 来 自 军 事 意义 上 的 护卫 (convoy)， 
护卫 表示 一 组 车 辆 一 起 行动 。 当 然 了 ， 在 军事 里 ， 护 卫 是 个 好 事 ， 因 为 这 些 车 辆 在 紧急 情况 
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下 可 以 互相 援 护 。 在 高 速 公 路 上 你 在 单车 道路 段 被 挡 在 一 辆 慢车 后 面 时 ， 就 不 自觉 地 属于 一 
个 “护卫 ”。 对 CPU 来 说 ， 短 作业 (P2 和 P3) 就 被 长 作业 (P1 ) 挡 到 了 后 面 。 护 送 效应 是 先 
到 先 服务 调度 算法 所 特有 的 问题 ， 源 自 于 这 种 调度 思想 的 本 质 。 我 们 中 的 很 多 人 都 经 历 过 在 
结账 时 发 现 前 面 的 顾客 有 满 满 一 车 的 货物 ， 而 自己 只 买 那么 几 样 东西 的 情况 。 不 幸 的 是 ， 护 
送 效 应 根源 于 先 到 先 服务 的 调度 思想 ， 因 此 根据 它 的 本 质 ， 它 就 没有 对 较 短 的 作业 给 予 任何 


首选 考虑 。 
ol 
P1 P2 P3 
1 2 7 


10 10 1 2 


Al 6-12” 先 到 先 服 务 算法 的 护送 效应 ， 短 作业 (P2，P3 ) 由 于 先 到 先 服务 算法 的 特点 而 
卡 在 一 个 长 作业 (P1) 之 后 





考虑 一 个 非 抢占 式 的 先 到 先 服 务 (FCFS) 进程 调度 器 。 在 调度 队列 中 有 3 个 进程 ， 到 达 上 顺序 是 
P1、P2 和 P3。 在 选择 接 下 来 运行 哪个 进程 时 总 是 根据 到 达 顺 序 进行 选择 。 调 度 从 t=0 开始 ，CPU 和 IO 
突 发 时 间 分 别 如 下 所 示 : 


CPU 突 发 时 间 VO 突 发 时 间 
Pl 8 2 
P2 5 5 
P3 1 5 
每 个 进程 都 在 完成 以 下 三 个 动作 的 操作 之 后 结束 : 
1. CPU 突 发 
2. IO RR 
3. CPU 突 发 


a. 展示 FCFS 调度 算法 导致 的 CPU 和 LO 时 间 轴 ， 从 t=0 开始 ， 直 到 三 个 进程 均 完成 为 止 。 
b. 各 个 进程 的 响应 时 间 是 多 少 ? 
c. 各 个 进程 的 等 待 时 间 是 多 少 ? 

答 : 

a. 


时 间 


一 
CPU 
8 


5 5 1 5 1 
MO 


8 
2 3 5 3 5 


8 1 5 
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注意 ， 在 t=8 时 ，P2 和 了 P3 都 在 就 绪 队 列 中 ， gpl et TL ih Y RB. pit 
器 根据 到 达 时 间 选 择 相 对 较 早 到 达 的 P2 在 处 理 器 上 运行 。t=10 时 ，P1 完成 UO， 回 到 就 绪 队 列 。 
这 时 候 已 经 在 就 绪 队 列 里 了 ， 但是， 凭借 更 早 的 到 达 由 加 Pl 在 就 绪 队 列 中 排 在 P3 之 前 。 aia 
什么 t=13 时 调度 器 选择 运行 的 进程 是 P1。 
b. 根据 每 个 进程 从 到 达到 离开 花费 的 总 时 间 计 算 响 应 时 间 。 
响应 时 间 (P1 )= 21 
响应 时 间 (P2 )= 26 
响应 时 间 (P3 )= 33 
c. 每 个 进程 在 CPU 上 执行 或 者 进行 IO 操作 时 都 是 在 进行 有 用 作业 。 因 此 ， 我们 通过 在 总 周转 
时 间 (或 者 延迟 时 间 ) 中 减 去 进程 的 有 用 作业 时 间 。 例 如 说 ， 对 Pl 来 说 ， 有 用 作业 时 间 
= 第 一 个 CPU RK+V0 突 发 + 第 二 个 CPU RR 
=8+2+8 
= 18 
因此 ，P1 的 等 待 时 间 如 下 : 
等 待 时 间 (P1 )=(21-18 )= 3 
类 似 地 ， 
等 待 时 间 (P2 )=( 26-15 )= 11 
等 待 时 间 (P3 )=(33-7 )= 26 


如 同 我 们 之 前 已 经 提 到 的 ， 调 度 絮 在 进程 的 整个 声明 周期 里 ， 选 择 哪 个 进程 在 CPU 运行 
时 都 会 考虑 到 达 时 间 。 而 且 ， 这 个 内 在 属性 只 对 CPU 调度 有 意义 ， 而 不 用 于 IO 调度 。 这 两 
点 可 以 从 以 下 例子 中 看 出 。 


考虑 一 个 先 到 先 服务 的 调度 器 。 假 设 调度 队列 中 有 3 个 进程 ， 且 它们 都 准备 好 运行 。 调 度 算法 
要 求 调度 器 在 选择 进程 时 总 是 按照 到 达 时 间 进 行 选 择 。 假 设 PI1 、P2 和 P3 按照 这 个 顺序 进入 系统 ， 调 度 
从 t=0 时 刻 开 始 。 
这 三 个 进程 的 CPU 和 IO 突 发 规律 如 下 所 示 : 
CPU VO CPU rO CPU 








PI 5 5 5 3 5 Pl 完成 
P2 2 5 5 P2 完成 
P3 3 2 2 P3 完成 
从 to 开始 ， 画 出 先 到 先 服务 算法 导致 的 CPU 和 LO 时 间 轴 ， 直 到 3 个 进程 完成 为 止 。 
答 : 
时 间 
0 10 15 17 20 
CPU 
pom [ele tom | e |» fr 
5 2 3 5 5 5 2 
I/O 
注意 : 


1. 在 t=15 时 刻 ，P3 和 P1 都 需要 进行 LO。 但 是 ，P3 先进 行 1/O 请 求 (在 t=10 时 刻 )， 而 Pl1 WM 
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0 TE 


在 之 后 才 发 出 请 求 (在 t=15 时 刻 )。 我 们 之 前 已 经 提 过 ，LO 请 求 是 按照 请 求 顺序 来 处 理 的 ， 因 此 ， 
P3 先 被 处 理 ， 然 后 才 是 P1。 

2. Æ t=20 时 刻 ，P1 和 P3 都 需要 在 CPU 上 运行 。 实 际 上 ,P3 在 t=17 时 刻 完 成 IJO， 而 P1 在 
t=20 时 刻 刚 刚 完 成 JO。 但 是 ，P1 在 竞争 中 胜出 ， 被 选择 在 CPU 上 和 运行， 因为 CPU 调度 器 在 进行 调 
度 决 定时 总 是 遵照 进程 到 达 的 时 间 顺 序 。 


6.6.2 最短 作业 优先 


术语 最 短 作业 来 自 于 店 里 的 调度 决定 一 一 比如 说 ， 在 汽车 修理 店 。 不 幸 的 是 ， 这 个 术语 
用 在 CPU 调度 上 单 从 字面 意思 解释 有 时 候 就 词 不 达意 了 。 因 为 CPU 调度 器 并 不 知道 某 个 程 
序 的 具体 行为 是 怎么 样 的 ， 它 只 能 利用 已 知 的 部 分 知识 来 进行 调度 。 在 最 短 作 业 优先 ( SJF， 
Shortest Job First) 算法 的 情形 中 ， 所 用 到 的 知识 就 是 所 需 的 CPU 突 发 时 间 ， 这 是 每 个 进程 都 
具有 的 内 在 属性 。 我 们 知道 ， 每 个 进程 依次 遇 到 CPU 和 LO 突 发 活动 。 最 短 作 业 优 先 调度 器 
查看 当前 可 以 运行 的 进程 集合 所 需 的 CPU 突 发 时 间 ， 并 选择 需要 CPU 突 发 最 短 的 一 个 。 回 
忆 本 和 曹 开 始 时 的 类 比 ， 你 在 给 妈妈 打 电 话 之 前 启动 洗衣 机 和 微波 炉 。 最 短 作 业 优 先 调度 需 采 
用 相同 的 原则 挑选 短 的 作业 先 做 。 现 实 中 ， 调 度 器 在 程序 启动 时 不 知道 它 的 CPU 突 发 时 间 ， 
但 是 它 可 以 根据 之 前 的 CPU 突 发 来 推断 进程 的 期 望 突 发 时 间 。 

最 短 作 业 优 先 算法 会 让 较 短 的 作业 获得 更 好 的 啊 应 时 间 。 而 且 ， 它 也 不 会 有 先 到 先 服务 
算法 的 护送 效应 ， 因 为 它 优先 选择 较 短 的 作业 。 实 际 上 该 算法 也 被 证 明了 能 得 到 最 好 的 平均 
等 待 时 间 。 图 6-13 展示 了 由 最 短 作 业 优 先 来 处 理 图 6-12 中 的 相同 进程 的 时 间 轴 。 三 个 进程 
Pl. P2 和 P3 的 等 待 时 间 分 别 是 4、0、9。 


P1 P2 P3 


1 2 1 10 2 8 10 
一 一 一 一 1 
I/O 
1 2 3 8 10 


图 6-13 BEWEER EE FORT ERE EY, EE T RIRA HIPS RY, 


注意 最 短 作 业 P2 在 这 种 调度 策略 下 得 到 了 最 好 的 服务 。 在 人 3 时 刻 ，P2 刚刚 完成 它 的 
IO 突 发 。 幸 运 的 是 ，P3 也 刚刚 完成 了 它 的 CPU 突 发 。 这 时 候 ， 尽 管 Pl 和 了 2 都 准备 好 在 
CPU 上 运行 了 ， 调度 器 却 会 因为 P2 需要 的 CPU 突 发 较 短 而 优先 选择 P2 而 不 是 P1。 在 时 刻 
t=4, P2 完成 了 它 的 第 一 个 CPU 突 发 。 由 于 没有 其 他 更 短 的 作业 可 供 调 度 ，P1 得 到 了 在 CPU 
上 运行 的 机 会 。 在 t=6 时刻，P3 刚刚 完成 它 的 ORE, WERE CPU 上 调度 执行 。 但 是 ， 
Pl 正在 处 理 器 上 执行 。 由 于 调度 器 是 非 抢 占 式 的 ，P3 只 好 等 待 P1 主动 放弃 CPU (P1 在 t=14 
时 这 么 做 了 )。 

最 短 作业 优先 调度 可 能 会 导致 长 作业 的 饥饿 。 在 前 面 的 例子 里 ， 在 轮 到 PLATA, 更 
新 的 较 短 的 作业 可 能 会 进入 系统 。 因 此 ，P1 可 能 会 等 待 很 长 时 间 ， 其 至 一 直 等 下 去 。 为 了 解 
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决 此 问题 ， 一 个 被 称 作 老化 的 技术 会 优先 选择 已 经 待 在 就 绪 队 列 中 等 待 了 很 久 的 作业 (与 其 
他 较 短 的 作业 相 比 )。 基 本 上 这 里 的 想法 就 是 让 调度 器 为 每 个 作业 增加 一 个 新 的 属性 ， 即 它 进 
入 调度 列表 中 的 时 刻 。 当 一 个 作业 的 年 龄 超过 了 一 定 界限 ， 调 度 器 就 会 忽略 最 短 作 业 优先 原 
则 ， 而 优先 选择 这 样 的 作业 来 调度 。 


ERJ 考虑 一 个 非 抢占 式 的 最 短 作 业 优 先 (SJF) 进程 调度 器 。 假 设 在 调度 队列 里 有 三 个 进程 ， 且 都 准 
备 好 运行 。 该 调度 算法 要 求 每 次 都 选择 可 以 运行 的 进程 中 最 短 的 一 个 。 调 度 从 t=0 时 刻 开始 。 三 个 进程 
的 CPU 和 LO 突 发 规律 如 下 所 示 : 

CPU I/O CPU I/O CPU 


Pl 4 2 4 2 4 Pl 完成 
P2 5 2 5 P2 完成 
P3 2 2 2 2 P3 完成 


每 个 进程 在 上 面 列 出 的 CPU 和 IO 突 发 完成 以 后 就 退出 系统 。 

a 画 出 在 最 短 作 业 优 先 调度 下 ， 从 t=0 开始 的 CPU 和 1/O 时 间 轴 ， 直 到 三 个 进程 全 都 退出 系统 。 
b. 各 个 进程 的 等 待 时 间 是 多 少 ? 

c. 整个 系统 的 平均 吞吐 量 是 多 少 ? 
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i. 
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2 
VO 调度 
2 2 2 2 2 2 4 5 2 


b. 我 们 用 和 例 6-1 相同 的 方法 计算 各 个 进程 的 等 待 时 间 : 
等 待 时 间 (P1 )=(18 - 16) = 2 
等 待 时 间 (P2 )=(30 - 12) = 18 
等 待 时 间 (P3 )=(14- 10)=4 
c. 总 时 间 =30 
吞吐 量 = 完成 的 进程 个 数 /总 时 间 
=3/ 30 
=1/10 进程 每 单位 时 间 


6.6.3 ”优先 级 


出 于 调度 的 目的 ， 多 数 操作 系统 都 会 给 每 个 进程 赋 子 一 人 1 级 ， 这 十 一 
个 小 整数 值 ， 用 来 表示 它 与 其 他 进程 相 比 的 相对 重要 性 。 比 如 说 ， 在 Unix 操作 系统 中 每 个 用 
户 级 进程 开始 时 都 有 固定 的 默认 优先 级 。 就 绪 队 列 包含 多 个 子 队 列 ， 每 个 对 应 着 一 个 优先 级 ， 
如 图 6-14 所 示 。 
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图 6-14 ”优先 级 调度 需 的 多 个 就 绪 队 列 。 调 度 咒 可 能 随 着 时 间 推 移 将 进程 在 不 同 的 优先 
级 之 间 移 动 


每 个 优先 级 内 部 的 调度 是 先 到 先 服务 的 。 新 的 进程 放 在 与 它们 优先 级 相对 应 的 队列 中 。 
因为 优先 级 是 个 外 来 属性 ， 调 度 咒 可 以 完全 控制 不 同 进 程 的 优先 级 分 配 。 这 个 调度 方式 与 先 
到 先 服务 或 者 最 短 作 业 优先 相 比 十 分 灵活 。 例 如 ， 调 度 器 可 以 根据 用 户 的 级 别 来 分 配 优先 级 。 
从 数据 中 心 9 运 营 者 的 角度 来 说 这 可 能 特别 有 吸引 力 ， 那 里 不 同 的 用 户 可 能 会 愿意 为 他 们 各 自 
的 作业 支付 不 同 的 价格 。 

优先 级 是 个 给 不 同 用 户 提 供 差 异 服务 的 自然 方式 。 不 仅仅 在 处 理 器 调度 中 是 如 此 ， 在 日 
常生 活 的 几乎 每 个 方面 都 是 这 样 。 一 个 例子 是 ， 公 司 负 责 处 理 客服 请 求 的 呼叫 中 心 会 把 不 同 
的 拨打 者 依据 它们 的 档案 放 进 不 同 的 队列 里 。 难 缠 的 拨打 者 被 塞 进 与 更 受 欢 迎 的 拨打 者 相 比 
更 慢 的 队列 里 。 类 似 地 ， 航 空 公司 用 头等 舱 、 商 务 舱 和 经 济 舱 作 为 给 客户 划分 优先 级 的 方式 。 

只 需 回想 一 下 ， 就 能 发 现 最 短 作 业 优 先 其 实 只 是 优先 级 调度 的 一 个 特例 ， 其 中 优先 级 

L=1/CPU 突 发 时 间 


因此 ， 类 似 于 最 短 作 业 优 先 ， 优 移 级 调度 硕 也 有 低 优先 级 进程 会 饥 俄 的 问题 。 显 然 ， 我 们 
可 以 通过 给 每 个 进程 分 配 显 式 的 优先 级 的 方法 来 解决 这 个 问题 。 类 似 于 我 们 在 讨论 最 短 作业 优 
先 时 所 提 到 的 ， 在 一 个 进程 的 年 龄 达到 某 个 界限 以 后 ， 调 度 器 会 人 为 地 提升 进程 的 优先 级 。 

想 想 看 就 会 意识 到 先 到 先 服务 调度 也 是 一 种 基于 优先 级 的 算法 。 不 过 调度 器 是 用 进程 的 
到 达 时 间 来 作为 它 的 优先 级 的 。 因 此 ， 在 先 到 先 服务 算法 中 新 进程 的 优先 级 一 定 不 会 比 原 有 
的 进程 高 ， 这 也 就 是 为 什么 先 到 先 服务 算法 不 会 有 饥饿 问题 的 原因 。 

由 于 与 先 到 先 服务 算法 的 相似 性 ， 基 于 优先 级 的 算法 也 可 能 展现 出 护送 效应 。 让 我 们 来 
看 看 这 为 什么 会 发 生 : 如 果 一 个 高 优先 级 的 进程 恰好 是 个 长 时 间 运 行 的 进程 ,我们 可 能 就 会 
处 于 类 似 于 先 到 先 服务 调度 中 的 状况 。 但 是 ， 在 先 到 先 服务 算法 里 ， 进 程 的 优先 级 一 旦 确定 
了 就 绝 不 更 改 。 但 是 基于 优先 级 的 调度 器 可 不 必 如 此 ， 用 来 殉 服 饥饿 问题 的 机 制 ( 即 根据 进 
程 年 龄 来 提高 优先 级 ) 也 有 助 于 消除 护送 效应 。 


6.7 抢占 式 调度 算法 


这 一 类 调度 算法 同时 意味 着 两 件 事情 。 一 方面 ， 调 度 需 可 以 随时 得 到 处 理 器 的 控制 权 ， 
而 完全 不 用 让 正在 运行 的 进程 知道 。 另 一 方面 ， 调 度 器 能 够 把 当前 运行 的 进程 的 状态 保存 下 


提 ” 作 为 一 种 没有 高 性 能 计算 资源 的 用 户 获取 该 资源 的 方式 ， 数 据 中 心 变 得 越 来 越 普及 了 。 诸 如 亚 马 了 进 、 微 
软 、 惠 普 和 IBM 等 公司 都 处 在 提供 此 类 服务 的 第 一 线 。 云 计算 是 提供 此 类 服务 的 业界 流行 语 。 
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来 ， 以 便 能 够 正确 地 从 被 抢占 的 地 方 开 始 恢复 执行 。 回 到 本 章 开 始 时 我 们 的 类 比 上 去 ， 当 你 
在 给 妈妈 打 电 话 而 洗衣 机 发 出 蜂 鸣 的 时 候 ， 你 会 让 妈妈 等 一 会 儿 ， 而 脑 中 则 记 下 待 会 儿 继续 
通话 的 时 候 该 从 哪里 说 起 。 

原则 上 ， 上 一 节 中 讨论 的 任何 算法 都 能 被 改造 成 抢占 式 的 。 为 了 达到 这 个 目的 ， 在 先 到 
先 执行 算法 中 ,每 当 一 个 进程 在 完成 IO 重新 进入 就 绪 队 列 时 ， 调 度 器 可 以 决定 抢占 当前 正 
在 执行 的 进程 (如 果 它 的 到 达 时 间 比 前 者 要 晚 )。 类 似 地 ， 对 于 最 短 作业 优先 和 优先 级 调度 ， 
调度 种 也 在 一 个 新 进程 或 者 刚刚 完成 IO 的 进程 进入 就 绪 队 列 时 重新 进行 评估 ， 以 决定 要 不 
要 抢占 当前 进程 的 执行 。 

最 短 剩余 时 间 优 先 (Shortest Remaining Time First, SRTF) 是 最 短 作业 优先 调度 器 的 一 种 特 
殊 情 况 ， 但 是 加 入 了 抢占 的 概念 。 调 度 器 估计 每 个 进程 的 运行 时 间 ， 当 一 个 进程 回 到 就 绪 队 列 ， 
调度 需 计 算 作 业 的 剩余 处 理 时 间 。 依 据 它 的 计算 结果 ， 调 度 器 将 进程 放 在 就 绪 队列 的 合适 位 置 。 
如 果 该 进程 的 剩余 时 间 比 当前 在 运行 的 进程 还 要 少 ， 调 度 器 就 抢占 后 者 以 运行 前 者 。 
考虑 以 下 四 个 争夺 CPU 的 进程 。 调 度 器 采用 最 短 剩 余 时 间 优先 算法 。 表 中 给 出 了 每 个 进程 的 
到 达 时 间 。 


He ED 


a 给 出 从 To 时 刻 开 始 的 调度 方案 。 

=: 

1) 在 To 时刻，P1 开始 运行 ， 因 为 没有 其 他 进程 。 

2) 在 Tu+l 时 刻 ，P2 到 达 。 下 表 展 示 了 此 刻 Pl 和 P2 的 剩余 所 需 运 行 时 间 : 


进程 剩余 时 间 
Pl 3 ms 
P2 2 ms 


调度 器 切换 到 P2。 
3) 在 Ti+2 时 刻 ，P3 到 达 。 下 表 展 示 了 此 刻 P1、P2 和 P3 的 剩余 所 需 运 行 时 间 : 


进程 剩余 时 间 
Pl 3 ms 
P2 ] ms 
P3 2 ms 


调度 器 继续 运行 P2。 
4) 在 Ti+3 HH), P4 到 达 。P2 完成 并 离开 。 下 表 展 示 了 此 刻 P1、P3 和 P4 的 剩余 所 需 运 行 时 间 : 


进程 剩余 时 间 
PI 3 ms 
P3 2 ms 


P4 2 ms 
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调度 器 选择 P3， 并 且 在 随后 的 2 ms 中 一 直 运 行 至 P3 结束 。 
5) 在 Tot5 时 刻 ，P1 和 P4 是 仅 剩 的 两 个 进程 ， 剩 余 所 需 运 行 时 间 如 下 : 


剩余 时 间 
3 ms 


3 ms 


平手 了 ， 调 度 器 就 根据 到 达 顺 序 (P1 在 先 ，P4 在 后 ) 来 进行 选择 ， 这 种 选择 也 会 降低 平均 等 待 时 间 。 
下 表 展 示 了 最 少 剩 余 时 间 优 先 调度 的 结果 : 
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Korem] o | |2 | | + Ts ToT |s| o|o] 
mamma | ei | ei | er | er | or |2 | es | es | ea | ea e | 


e. 先 到 达 先 处 理 算 法 的 平均 等 待 时 间 是 多 少 ? 
答 : 


b. 进程 的 平均 等 待 时 间 是 多 少 ? 


响应 时 间 = 完成 时 间 — 到 达 时 间 


Ro = 8-0 = 8ms 
Re = 3-1 = 2ms 
Rg = 3-2 = Sins 


R,, = 11-3 = 8ms 

等 待 时 间 = 响应 时 间 一 执行 时 间 
Wy = R pr -Ep = 8-4 = 4 ms 

Wa = Ry Ep = 2-2 = 0: ms 
Wa= Ry-Es=3-2= T ms 

Wu = Re Ey 8-3'= 5 ms 


c. 平均 等 待 时 间 是 多 少 ? 


总 等 待 时 间 =W+Wo+Wa+W4=10 ms 
平均 等 待 时 间 = 10/4 = 2.5 ms 


d. 如 果 换 成 先 到 先 服务 调度 策略 ， 处 理 相 同 的 一 组 进程 的 调度 方案 会 是 什么 样子 ? 





响应 时 间 = 完成 时 间 一 到 达 时 间 
R,, = 4-0 = 4ms 

Ra=6-1 = 5ms 

R,; = 8-2 = 6ms 

R = 11-3 = 8ms 

等 待 时 间 = 响应 时 间 一 执行 时 间 
Wa = Ry Er = 44 = 0 ms 

W2 = Re -Ep = 5-2 = 3 ms 

W = R,s-E,3 = 6-2 = 4 ms 

W = Rys—E,s = 8-3 = 5 ms 
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Z: 
总 等 待 时 间 = W,, + Wa + Wia+ Wn= 12 ms 
平均 等 待 时 间 = 12/4 = 3 ms 
+: 可 以 看 出 ， 与 先 到 先 服 务 相 比 ， 最 短 剩 余 时 间 优 先 算法 的 平均 等 待 时 间 是 较 低 的 。 


6.7.1 轮转 调度 器 


让 我 们 找 出 适合 分 时 环境 的 调度 需 的 特点 。 分 时 环境 的 名 字 就 隐 含 了 一 点 ， 即 每 个 进程 
都 应 该 得 到 处 理 器 时 间 的 一 部 分 。 因 此 ， 非 抢占 式 的 调度 器 就 不 适合 这 种 环境 。 

分 时 环境 特别 适合 采用 轮转 (Round Robin, RR) 调度 器 。 假 设 有 mn 个 就 绪 的 进程 ， 调 度 器 
把 处 理 融 分 成 时 间 段 ， 一 般 称 作 时 间 片 ， 然 后 分 配给 各 个 进程 (参见 图 6-15 )。 你 能 看 出 这 类 
调度 各 与 本 章 开始 时 在 关于 准备 考试 的 类 比 里 提 到 的 第 一 种 策略 是 有 联系 的 。 轮 转调 度 器 在 就 
绪 进 程 之 间 轮 流 切 换 也 不 是 没有 代价 的 。 选 择 合适 的 时 间 段 q 时 一 定 要 考虑 上 下 文 切换 时 间 。 


系统 参数 
时 间 段 = q 









图 6-15 ”轮转 调度 器 。 每 个 进程 得 到 一 个 时 间 段 的 时 间 以 在 处 理化 上 运行 ， 然 后 被 上 下 
文 切换 走 ， 以 便 运 行 下 一 个 进程 


就 绪 队 列 里 的 每 个 进程 都 得 到 处 理 器 的 一 个 时 间 片 q9。 当 时 间 片 用 完了 ， 当 前 调度 的 进 
程 就 被 放 在 就 绪 队 列 的 尾部 ， 而 就 绪 队 列 中 的 下 一 个 进程 则 被 调度 到 处 理 右 上 

我 们 也 可 以 在 轮转 调度 器 和 先 到 先 服务 调度 器 之 间 找 出 联系 。 先 到 先 服务 调度 右 是 轮转 
调度 器 的 一 种 特殊 情况 ， 即 时 间 段 是 无 穷 长 。 处 理 器 分 享 也 是 轮转 调度 的 一 种 特 丈 情况， 此 
时 每 个 进程 都 得 到 处 理 器 的 1 个 单位 的 时 间 ， 因 此 每 个 进程 都 能 假想 自己 独占 运行 在 一 个 速 
度 是 ln 的 处 理 器 上 。 共 享 处理 器 的 观念 对 于 证 明 调度 方面 的 理论 结果 很 有 帮助 。 

让 轮转 调度 器 工作 ”让 我 们 考虑 一 个 轮转 调度 天 的 例子 。 图 6-16 给 出 了 三 个 进程 的 CPU 
Al VO 突 发 情况 。 假 设 进程 的 到 达 顺 序 是 P1、P2、P3 ; 并 且 调 度 器 用 的 时 间 片 大 小 为 2。 每 
个 进程 都 在 图 中 所 示 的 CPU 和 LO 突 发 完成 之 后 离开 系统 。 





图 6-16 轮转 调度 器 示例 中 的 CPU Al VO RR 


176 BOF 


在 时 刻 t=0 时 ， 调 度 队 列 如 图 6-17 所 示 。 需 要 注意 的 关键 地 方 是 此 刻 的 顺序 不 一 定 会 一 
直 保 持 下 去 ， 因 为 进程 在 CPU 和 IO 队列 之 


就 绪 队 列 
间 来 加 移动。 当 一 个 进程 重新 加 入 CPU 或 者 


VO 队列 时 ， 总 是 会 插 到 队 尾 ， 因 为 进程 没有 图 6-17 图 6-16 中 例子 里 {0 时刻 的 就 绪 队 列 





任何 内 在 的 优先 级 . 

图 6-18 展示 了 前 17 个 时 间 单 位 (从 t=0 到 ,CPU 调度 ( tete, PIRI) 
16) 的 调度 情况 。 注 意 P2 只 用 到 了 分 配给 en ate 
它 的 2 个 时 间 单 位 中 的 1 个 ， 因 为 它 在 3 个 单 PP 
位 的 CPU 突 发 之 后 就 进入 了 IO 突 发 。 换 句 话 12 34 56 7 89 1011213141516 
说 ,在 轮转 调度 中 ， 时 间 片 是 进行 下 一 次 调度 时 间 轴 
决策 之 前 连续 使 用 CPU 的 时 间 上 限 。 而且, 在 VO 调度 se eae a 
t=12 时 刻 ，P2 刚刚 完成 它 的 VORA, MER 
回 到 CPU 队列 。 此 时 P1 正在 它 的 CPU 时 间 片 Di0 pB 
当中 ， 而 P3 也 在 就 绪 队 列 里 。 因 此 ，P2 回 到 = a 7 & 
就 绪 队 列 里 ， 排 在 P3 之 后 ， 如 图 6-19 所 示 。 图 6-18 图 6-16 PATIFE 
如 果 采 用 轮转 调度 ， 图 6-16 中 的 三 个 进程 的 等 待 时 间 分 别 是 多 少 ? 

ae 


类 似 于 例 6-1 和 例 6-3. 
等 待 时 间 =( 响 应 时 间 - 在 CPU 或 者 IO 上 花费 的 有 用 时 间 ) 
Pl 的 等 待 时 间 =(13 一 8) = 5 
P2 的 等 待 时 间 =(17 一 7)= 10 
P3 的 等 待 时 间 =(17 一 10)=7 


轮转 算法 的 细节 ”让 我 们 把 注意 力 转 移 到 调 就 绪 队 列 
度 器 如 何 得 到 处 理 器 的 控制 权 上 。 有 一 个 硬件 装 
置 ， 即 定时 硕 ， 会 在 经 过 时 间 q 之 后 中 断 处 理 程 ”图 6-19 图 6-18 的 例子 中 t=12 时 刻 的 就 绪 队 列 
序 。 处 理 定时 器 中 断 的 中 断 处 理 程序 是 轮转 调度 
器 的 一 部 分 。 图 6-20 展示 了 这 个 系统 的 各 个 层面 。 在 任何 时 候 ， 处 理 器 要 不 然 在 运行 调度 器 ， 
要 不 然 在 运行 某 个 用 户 程序 。 考 虑 某 个 正 运行 在 处 理 器 上 的 用 户 程序 。 在 遇 到 中 断 时 ， 时 钟 中 
断 处 理 程序 会 获得 处 理 器 的 控制 权 (参考 在 第 4 章 中 阅 述 的 发 生 中 断 时 的 处 理 步骤 )。 处 理 程序 
将 正在 运行 的 用 户 程序 的 上 下 文保 存 进 相应 的 PCB， 并 把 控制 权 移交 给 调度 器 。 这 个 切换 过 程 
被 称 作 上 行 调 用 ， 它 使 得 调度 器 可 以 运行 它 自 己 的 调度 算法 ， 以 选择 下 一 个 分 发 到 处 理 器 上 的 

程 。 一 般 来 说 ， 上 行 调用 是 指 从 系统 软件 的 低层 调用 上 层 的 某 个 系统 因数 ( 即 过 程 调用 )。 

图 6-21 总 结 了 轮转 调度 算法 。 算 法 由 五 个 过 程 组 成 : DRE. CHB PHRF. VO 
RBA, VO 完成 中 断 处 理 程序 、 以 及 进程 终止 陷入 处 理 器 。 

分 发 器 只 需要 把 就 绪 队 列 头 部 的 进程 分 发 到 处 理 器 上 ， 并 且 把 定时 器 设 定 到 时 间 段 q 就 好 
了 。 当 前 调度 的 进程 可 能 会 以 以 下 三 种 方式 放弃 处 理 器 : 进行 IO 请 求 、 结 束 运行 ， 或 者 是 用 
完 在 处 理 器 上 分 配 到 的 时 间 。LILO 请 求 陷 入 是 第 一 个 选项 的 表现 。 比 如 说 ， 如 果 当 前 调度 的 进 
程 产生 了 一 个 从 磁盘 读 取 文件 的 请 求 。 这 种 情况 下 ，1/O 请 求 陷 入 会 把 当前 调度 的 进程 的 状态 
保存 到 进程 控制 块 里 ， 把 它 移动 到 IO 队列 去 ， 然 后 上 行 调用 分 发 器 。 定 时 器 中 断 处 理 程序 则 
是 当前 进程 时 间 片 用 完 的 表现 。 硬 件 定时 器 会 中 断 处 理 程 序 ， 从 而 调用 该 处 理 程 序 。 如 图 6-21 


PEAS ER ie FP DB AL EH FE HALE AR AS Po FB GE i EE SEE RH id BR oH BE 
ZA BNA ARE, Ya TIA Ait. 在 IO 请 求 完成 的 时 候 ， 处 理 器 会 得 到 一 个 IO 完成 中 
断 。 该 中 断 会 导致 VO 完成 处 理 程 序 被 调用 。 这 个 处 理 程序 的 作用 就 有 点 复杂 了 。 某 个 进程 还 
在 处 理 器 上 执行 ， 而 且 它 既然 在 执行 ， 就 说 明 它 的 时 间 片 还 没 用 完 。 处 理 程序 简单 地 把 当前 热 
行 的 程序 的 状态 保存 到 进程 控制 块 。LO 完成 代表 的 是 当初 进行 VO 请 求 的 那个 进程 。 处 理 程序 
把 该 进行 IO 请 求 的 进程 对 应 的 进程 控制 块 移动 到 就 绪 队 列 的 末尾 ， 并 上 行 调 用 分 发 右 。 分 发 
从 会 做 必要 的 操作 ， 以 分 发 被 IO 完成 中 断 打 断 的 那个 进程 〈 因 为 它 还 剩 有 处 理 融 时 间 )。 最 后 ， 
进程 终止 处 理 程序 只 需要 把 进程 的 控制 块 释放 ， 从 就 绪 队 列 中 移 除 ， 然 后 上 行 调 用 分 发 器 即 可 。 


上 行 调用 





oro 


图 6-20 ”采用 了 轮转 调度 器 的 系统 的 不 同 层 面 。 轮 转调 度 需 的 不 同 组 件 在 当前 运行 的 进 
程 主动 要 求 或 者 系统 状态 变化 时 调用 


分 发 器 : 

得 到 就 绪 队 列队 首 的 进程 控制 块 
设 定 定 时 器 

分 发 
定时 器 中 断 处 理 程序 : 

把 上 下 文保 存 到 进程 控制 块 
把 进程 控制 块 移 到 就 绪 队 列 尾部 
上 行 调用 分 发 器 
I/O 请 求 陷 入 : 

把 上 下 文保 存 到 进程 控制 块 
把 进程 控制 块 移 到 UVO 队列 ; 

上 行 调 用 分 发 硕 
IO 完成 陷入 处 理 程 序 : 

把 上 下 文保 存 到 进程 控制 块 
把 完成 了 VO 的 进程 的 控制 块 移 到 就 绪 队 列 ; 
LÍTI ARE 
进程 终止 陷入 处 理 程序 : 

释放 进程 控制 块 

上 行 调 用 分 发 器 





图 6-21 轮转 调度 算法 
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6.8 结合 优先 级 和 抢占 


诸如 Unix 和 Microsoft Windows XP 等 通用 系统 在 CPU 调度 算法 中 结合 使 用 优先 级 和 
抢占 的 概念 。 进 程 有 对 应 的 优先 级 ， 在 创建 的 时 候 由 操作 系统 决定 。 它 们 被 安排 进 一 个 多 
级 的 就 绪 队 列 ， 类 似 于 图 6-14 中 的 那样 。 另 外 ， 对 于 所 有 特定 优先 级 的 进程 来 说 ， 操 作 系 
统 采 用 一 个 固定 时 间 段 的 轮转 调度 希 。 在 没有 更 高 优先 级 的 进程 时 将 会 处 理 低 优先 级 的 进 
程 。 为 了 避免 饥 俄 ， 操 作 系 统 可 能 会 周期 性 地 提升 长 时 间 没 有 被 执行 的 进程 的 优先 级 〈 即 老 
化 )。 另 外 ， 操 作 系 统 可 能 会 给 高 优先 级 进程 更 大 的 时 间 片 。 这 样 的 调度 器 的 软件 系统 的 结 
构 如 图 6-20 所 示 。 


6.9 元 调度 器 


在 有 些 要 应 对 多 种 需求 的 系统 中 ,调度 环境 可 能 由 多 个 就 绪 队 列 组 成 ， 每 个 都 有 各 自 的 
调度 算法 。 例 如 ， 有 个 队列 用 来 处 理 前 台 的 交互 式 作 业 (并 且 有 个 相应 的 调度 器 )， 另 一 个 队 
列 用 来 处 理 后 台 的 批 处 理 作业 (并 且 也 有 个 相应 的 调度 器 )。 交 互 式 的 作业 按照 轮转 的 方式 来 
调度 ， 而 后 台 作 业 则 采用 一 个 基于 优先 度 的 先 到 先 服务 算法 进行 调度 。 在 它们 之 上 则 是 一 个 
元 调度 器 ， 把 时 间 片 分 给 这 些 调度 器 (如 图 6-22 所 示 )。 参 数 Q 是 元 调度 器 给 下 一 层 的 两 个 
调度 需 分 配 时 间 段 。 元 调度 需 通 常 也 提供 因为 应 用 程序 (被 不 同 进 程 所 代表 ) 需求 的 动态 变更 
而 把 作业 在 两 个 低级 调度 器 的 就 绪 队 列 之 间 移 动 的 功能 。 







制 块 n 
交互 式 作 业 
的 调度 需 


就 绪 队 列 7 bes 
制 块 n 


图 6-22 ”元 调度 硕 。 每 类 作业 有 一 个 调度 硕 。 元 调度 希 给 这 些 进 程 级 调度 器 分 配 时 间 片 


此 元 调度 此 的 一 个 推广 被 用 在 网 格 计算 中 ， 这 是 一 种 有 点 游牧 性 的 基于 因特网 的 计算 基 
础 设施 ， 因 它 能 给 供给 用 户 使 用 高 性 能 计算 资源 而 不 必 真 的 拥有 它们 ， 而 在 获得 吸引 力 。 网 
格 计算 使 用 可 能 在 地 理 上 分 散 ， 并 且 穿 过 多 个 行政 单位 的 计算 资源 。 网 格 这 一 术语 源 目 对 计 
算 资 源 的 安排 类 似 与 分 配 电 力 的 “电网 ”。 网 格 的 用 户 把 作业 提交 给 这 个 环境 ,然后 作业 被 分 
布 式 的 计算 资源 所 执行 。 术 语 高 性 能 指 的 是 可 能 有 几 百 甚至 几 千 个 计算 资源 协同 工作 以 满足 
该 应 用 的 计算 需要 。 例 如 说 ， 一 个 这 种 基础 设施 的 应 用 可 能 是 全 球 气 候 模式 。 建 议 有 兴趣 的 
读者 参阅 关于 网 格 计 算 的 高 级 书本 [Foster，2003]。 
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6.10 评价 


我 们 应 当 怎 么 评价 调度 器 的 效率 呢 ? 任何 一 个 操作 系统 实体 的 关键 属性 是 快速 提供 用 户 
所 请 求 的 资源 ， 然 后 让 开 。 调 度 算法 根据 我 们 之 前 在 讨论 具体 的 部 署 环境 时 提 到 的 性 能 指标 
进行 评价 。 根 据 诸 如 分 时 的 、 面 向 批 处 理 的 和 多 道 编程 的 等 属性 刻画 不 同 的 环境 。 这 些 环境 
针对 不 同 的 市 场 力量 或 者 计算 的 应 用 领域 。 例 如 ， 我 们 现在 可 以 区 分 出 以 下 计算 扮演 着 重要 
角色 的 领域 : | 
。 桌面 和 膝 上 型 计算 机 我 们 对 这 种 个 人 计算 机 领域 再 熟悉 不 过 了 。 我 们 用 这 个 类 别 来 
称呼 那些 用 来 做 字 人 处理、 软件 开发 一 类 事情 的 计算 机 。 
。 服务 器 : 这 是 邮件 服务 器 、 文 件 服务 器 和 Web 服务 器 的 领域 。 
。 商 用 : 这 类 包括 电子 商务 和 金融 应 用 ， 经 常 被 用 作 企 业 计 算 的 同义词 。 
。 高 性 能 计算 (HPC, High Performance Computing) 这 是 需要 高 性 能 计算 资源 来 解决 科 
学 和 工程 问题 的 领域 。 
。 网 格 ”该 领域 包含 高 性 能 计算 的 所 有 元 素 ， 外 加 一 点 : 计算 机 可 能 是 地 理 上 分 开 的 ( 比 
如 说 ， 一 些 在 东京 而 另 一 些 在 班加罗尔 )， 并 且 可 能 跨 过 行政 界限 (比如 说 ， 一 些 属于 
佐治 亚 理工 而 另 一 些 属于 麻 省 理工 )。 
。 散 入 式 ” 随 着 包括 手机 、iPOD 和 iPhone 等 在 内 的 个 人 数字 助手 的 流行 ， 本 领域 正在 成 
为 支配 地 位 的 领域 。 本 领域 也 包含 汽车 、 飞 机 和 空间 探索 中 用 到 的 专门 的 计算 系统 。 
。 普 适 计算 ”这 个 正在 兴起 的 领域 结合 了 高 性 能 计算 和 组 入 式 计算 的 元 素 。 机 场 部 署 摄 
像 头 网 络 来 进行 视频 监控 就 是 此 领域 的 一 个 例子 。 
我 们 采用 负载 一 词 来 表示 特定 领域 中 典型 应 用 的 特点 。 可 以 把 负载 宽泛 地 分 为 两 大 类 ， 
即 IO 受 限 的 和 计算 受 限 的 。 但 是 ， 读 者 应 当 注 意 这 个 宽泛 的 分 类 并 不 总 是 有 用 的 ， 尤 其 是 
在 VO 的 情形 时 。 这 是 因为 不 同 领域 的 应 用 中 的 IO 的 本 质 差 别 很 大 。 例 如 ， 你 可 以 说 商务 应 用 
FRM / 膝 上 计算 机 都 是 IO 密集 的 。 商 务 应 用 要 操作 大 型 的 数据 库 ， 因 此 会 涉及 大 量 的 IO ; 桌 
面 计算 也 是 IO 受 限 的 ， 但 是 和 商务 计算 的 不 同 之 处 在 于 它 是 交互 式 的 IO， 而 不 是 与 大 容量 
存储 设备 (比如 磁盘 ) 之 间 的 交互 。 服 务 器 ， 高 性 能 计算 和 网 格 领域 的 应 用 都 趋向 于 是 计算 密 
集 型 的 。 风 入 式 和 普 适 计算 与 前 述 的 领域 很 不 一 样 。 这 一 类 的 领域 部 署 需 要 快速 反应 的 传 感 
佑 和 执行 元 件 (比如 摄像 头 、 麦 克 风 、 温 度 传感器 和 警报 器 )， 类 似 于 交互 式 的 负载 ; 同时 ， 
对 传感器 数据 的 分 析 ( 例 如， 摄像 头 图 像 ) 又 倾向 于 计算 密集 。 
K 6-5 总 结 了 这 些 不 同 领域 的 特征 。 


表 6-5 不 同 的 应 用 领域 


领域 调度 器 类 型 
桌面 中 期 、 短 期 、 分 发 器 
服务 器 中 期 、 短 期 、 分 发 器 
商务 中 期 、 短 期 、 分 发 器 
高 性 能 计算 受 限 中 期 、 短 期 、 分 发 器 
网 格 长 期 、 中 期 、 短 期 、 分 发 器 
联 入 式 中 期 、 短 期 、 分 发 器 
Ae 


mä 中 期 、 短 期 、 分 发 器 
我 们 可 以 采用 三 种 不 同 的 手段 来 评估 调度 器 : 建 模 、 模 拟 和 实现 。 这 三 种 手段 各 有 优 劣 。 
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建 模 是 指 推导 该 系统 的 数学 模型 (采用 诸如 排队 论 一 类 的 技术 )。 模 拟 是 指 开发 一 个 计算 机 程 
序 以 模拟 该 系统 的 行为 。 最 后 ， 实 现 是 指 把 该 算法 实际 部 著 到 操作 系统 中 去 。 建 模 、 模 拟 和 
实现 ， 以 这 个 顺序 代表 了 递增 的 投入 。 对 应 的 是 ， 这 些 手 段 获 得 的 回报 (在 理解 该 系统 的 性 
能 潜力 这 方面 ) 也 与 投入 相当 。 同 时 ， 建 模 和 模拟 使 得 我 们 可 以 问 “ 如 果 …… 会 怎样 ?” 的 问 
题 ， 而 实现 则 只 能 锁定 固定 的 算法 ， 使 得 试验 不 同 的 设计 选项 变 得 困难 。 一 般 来 说 ， 系 统 性 
能 的 早期 评估 用 的 是 建 模 和 模拟 ， 然 后 才 是 投入 实际 实现 。 


6.11 调度 对 处 理 吕 体系 结构 的 影响 


迄今 为 止 ， 我 们 都 是 把 处 理 硕 当 作 一 个 黑 盒 子 。 在 讨论 了 各 种 处 理 需 调度 算法 之 后 ， 目 
然 会 考虑 操作 系统 的 这 个 功能 是 否 需 要 处 理 硕 体系 结构 的 特殊 文 持 。 当 一 个 进程 被 调度 在 处 
理 器 上 执行 以 后 ，ISA 就 得 符合 在 运行 的 程序 的 需求 。 我 们 在 第 2 章 就 已 经 讨论 过 这 部 分 是 
怎么 处 理 的 了 。 进 程 调度 算法 本 身 也 类 似 于 用 户 级 的 程序 ， 因 此 在 ISA 这 方面 来 说 它们 的 需 
求 也 没什么 特别 之 处 。 因 此 ， 是 在 迁移 过 程 中 一 一 即 从 一 个 进程 上 下 文 切 换 到 为 一 个 进程 的 
过 程 中 一 一 处 理 右 体系 结构 可 以 为 操作 系统 提供 一 些 特别 的 支持 。 

让 我 们 把 它 分开 考 虑 ， 以 便 能 理解 处 理 带 体系 结构 对 调度 进行 支持 的 机 会 在 哪里 。 首 先 ， 
因为 现代 操作 系统 文 持 抢占 ， 处 理 器 体系 结构 必须 得 提供 一 种 中 断 当 前 执行 的 程序 的 方法 ， 以 
使 得 操作 系统 可 以 获得 处 理 需 的 控制 权 ， 并 运行 调度 算法 而 不 是 用 户 程 序 。 我 们 已 经 在 第 4 草 
中 了 解 了 这 种 处 理 咒 功能 。 有 具体 来 说 ， 处 理 咒 体系 结构 震 要 为 调度 器 提供 一 个 定时 器 装置 以 
便 它 进行 调度 决定 ， 并 且 为 进程 设置 时 间 段 。 另 外 ,指令 集 要 提供 特别 指令 来 开关 中 断 以 确 
保 中 断 处 理 需 执行 一 组 指令 的 原子 性 2?。( 人 参见 第 4 章 关 于 此 主题 的 详细 讨论 。) 

执行 特权 指令 要 求 处 理 癌 处 在 特权 状态 中 一 一 这 是 为 了 确保 普通 的 用 户 程序 不 被 允许 运 
行 这 些 指令 。 我 们 在 第 4 EMAR, ADE TAP / 内 核 模式 的 操作 ， 正 是 为 了 这 个 原因 。 

调度 算法 会 修改 操作 系统 私有 的 数据 结构 (比如 进程 的 控制 块 )。 必 须 有 内 存 空间 的 分 隔 
来 给 操作 系统 开辟 一 块 用 户 进 程 不 能 访问 的 区 域 ， 以 确保 操作 系统 的 完整 性 ， 防 止 用 户 程 序 
无 意 或 者 恶意 地 对 操作 系统 数据 结构 的 毁坏 。 这 一 点 在 图 6-20 中 表现 了 出 来 。 在 随后 的 昔 市 
(参见 第 7、8 和 9 章 )， 我 们 将 会 更 加 详细 地 讨论 内 存 管理 和 内 存 层 次 结构 ， 它 们 会 帮助 实现 
用 户 程序 与 内 核 代码 的 隔离 。 现 在 这 个 时 候 ， 只 需要 说 提供 内 核 模式 的 操作 是 个 实现 用 户 程 
序 与 内 核 代 码 之 间 的 分 隔 的 方便 机 制 就 足够 了 。 

最 后 ， 让 我 们 考虑 上 下 文 切 换 一 一 也 就 是 把 当前 运行 进程 的 寄存 絮 值 保存 到 进程 控制 
块 一 一 并 且 用 下 一 个 分 发 到 处 理 器 上 的 进程 的 控制 块 中 的 寄存 器 值 填充 寄存 器 的 过 程 。 我 们 
知道 ， 这 一 步 必须 得 快 ， 操 作 系 统 才 能 高 效 。 这 里 是 处 理 器 指令 集 提 供 帮 助 的 机 会 。 某 些 体 
系 结构 (如 DEC VAX) 提供 单一 指令 负责 从 内 存 某 处 加 载 所 有 寄存 右 值 ， 以 及 类 似 地 ， 把 所 
有 寄存 器 值 存 到 内 存 。 虽 然 在 过 程 调 用 时 保存 和 恢复 哪些 寄存 器 的 值 可 以 是 有 选择 性 的 〈 参 
见 2.8 节 )， 在 上 下 文 切 换 的 时 候 操 作 系统 必须 假设 当前 运行 进程 的 所 有 寄存 从 都 与 该 进程 有 
关 ， 从 而 为 在 指令 集中 包含 这 条 指令 提供 了 依据 。 某 些 体系 结构 (如 Sun SPARC) 则 提供 等 
存 器 窗口 (参见 2.8 节 )， 可 以 用 来 维持 不 同 进程 的 上 下 文 不 同 ， 并 且 消 除 在 上 下 文 切换 时 保 
存 /恢复 所 有 寄存 器 的 需要 。 在 这 种 情况 中 ， 调 度 器 在 上 下 文 切换 时 只 需要 切换 到 与 新 进程 
相 联系 的 寄存 硕 窗口 就 行 了 。 

”© 不 管 是 这 里 还 是 其 他 地 方 ， 我 们 采用 原子 性 一 间 都 是 用 来 表示 一 个 操作 是 不 可 分 的 。 一 组 不 会 被 中 断 的 指 
今 序列 就 是 一 个 原子 性 动作 的 例子 。 我 们 会 在 第 12 章 讲 到 线程 同步 的 时 候 回顾 这 个 概念 。 











小 结 和 展望 
K 6-6 总 结 了 本 章 讨论 的 不 同调 度 算法 的 特征 。 对 于 感 兴趣 的 读者 来 说 ， 有 几 个 调度 方 


面 的 高 级 主题 。 本 章 讨论 的 策略 不 保证 任何 特定 的 服务 质量 。 有 几 种 环境 可 能 会 需要 这 种 保 


证 。 比 如 说 ， 火 箭 发 射 儿 、 飞 机 上 的 控制 系统 ， 或 者 是 核反应 堆 的 控制 系统 。 这 种 系统 ， 份 
称 实 时 系统 ， 需 要 确定 性 的 保证 ; 在 调度 方面 的 高 级 话题 就 包括 怎么 提供 这 种 实时 性 的 保证 。 
比如 说 ,截止 时 间 调 度 器 给 调度 需 提 供 关 于 任务 一 定 要 完成 的 截止 时 间 的 提示 。 调 度 器 将 利 
用 这 些 和 截止 时 间作 为 一 种 调度 时 用 来 决定 进程 优先 级 的 手段 。 

表 6-6 ”调度 算法 的 比较 


名 称 调度 标准 短处 


先 到 先 服务 本 身 是 非 抢 占 式 的 ; 到 达 时 间 (内 在 属性 ) | AF; EIR 响应 时 间 方 差 高 ; 
可 以 在 IO 完成 事件 护送 效应 
时 改 成 抢占 式 






















最 短 作业 优先 本 身 是 非 抢 占 式 的 ; 期 望 运行 时 间 (内 在 | 优先 选择 最 短 作 | 可 能 会 饥饿 ; 
可 以 在 新 任务 到 达 或 | 属性 ) 业 被 证 明 对 啊 应 来 | 对 长 时 间 运 行 的 计 
者 WO 完成 事件 时 改 成 说 是 最 理想 的 响应 | 算 不 利 


抢占 式 时 间 的 方差 低 
优先 级 可 以 是 非 抢 占 或 者 抢 | ”作业 的 优先 级 (外 来 | 高 度 灵活 ; 由 于 | REAL 


优先 级 不 是 内 在 属 
性 ， 可 以 根据 调度 
环境 的 需求 而 调节 
作业 的 优先 级 


最 短 剩余 时 间 作业 的 期 望 剩余 运行 与 最 短 作 业 优 先 类 似 

优先 但 是 是 抢占 式 的 类 似 

轮转 抢占 式 时 间 段 所 有 作业 机 会 均等 | 作业 间 上 下 文 切换 
的 相同 份额 


其 实 ， 很 多 现代 应 用 程序 也 都 需要 实时 性 的 保证 。 在 iPOD 上 播放 音乐 、 在 XBOX ESt 
游戏 ， 或 者 在 笔记 本 上 看 电影 ， 这 些 应 用 程序 都 需要 实时 性 的 保证 。 但 是 ， 错 过 截止 时 间 的 
影响 应 该 比 核 反应 堆 里 面 小 得 多 。 这 种 应 用 经 常 被 称 作 软 实时 应 用 ,已 经 成 为 通用 计算 机 上 
运行 的 应 用 程序 的 一 部 分 。 为 这 类 应 用 程序 进行 调度 也 是 一 个 可 以 探索 的 有 趣 话题 。 

先入 式 计 算 正 在 成 为 一 种 占 主导 地 位 的 环境 ， 取 得 了 不 少 进展 ， 比 如 手机 、iPOD 和 
iPhone 等 。 感 兴趣 的 读者 可 以 探索 此 类 环境 中 的 调度 问题 。 

超越 单 处 理 器 的 环境 ， 在 多 处 理 器 环境 上 调度 带 来 了 自己 的 一 组 挑战 。 我 们 把 关于 此 话 
题 的 讨论 推迟 到 本 书后 面 的 章节 。 最 后 ， 在 分 布 式 系统 中 调度 是 另 一 个 激动 人 心 的 话题 ,但 
是 超出 了 本 书 讨论 的 范畴 。 


Linux 调度 器 一 一 一 个 案例 研究 


我 们 已 经 提 到 过 ， 现 代 通 用 操作 系统 采用 本 章 中 所 介绍 技术 的 一 个 组 合 。 作 为 具体 的 例 
子 ， 让 我 们 来 看 看 Linux 中 是 怎么 调度 的 。 

Linux 是 一 个 开源 的 操作 系统 项 目 ， 这 意味 着 一 个 开发 者 社区 志愿 地 向 该 操作 系统 的 开 
发 贡献 了 代码 。 该 操作 系统 的 新 版 本 的 推出 有 一 定 的 规律 性 。 比 如 说 ,在 2007 年 12 月 左右 ， 
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内 核 编 号 是 2.6.23.12。 本 节 中 的 讨论 适用 于 在 Linux AY 2.6.x 版 本 中 采用 的 调度 框架 。 

Linux 给 我 们 提供 了 一 个 有 趣 的 案例 研究 机 会 ， 因 为 它 同 时 在 尝试 满足 两 种 不 同 的 环境 : 
(a) 桌面 计算 以 及 (b) 服务 器 。 桌 面 计算 意味 着 有 一 个 交互 式 环境 ， 其 中 响应 时 间 很 重要 。 这 
意味 着 调度 器 可 能 必须 得 经 常 进行 上 下 文 切换 以 满足 交互 性 要 求 (鼠标 点 击 、 键 盘 输入 ， 等 
等 )。 另 一 方面 ， 服 务 器 则 处 理 计 算 密 集 的 负载 ， 因 此 上 下 文 切换 越 少 ， 服 务 器 能 完成 的 作业 
就 越 多 。Linux 在 它 的 调度 算法 里 试图 满足 以 下 目标 : 

。 高 效率 ; 意味 着 花 在 调度 器 自身 的 时 间 要 尽 可 能 少 ， 这 是 服务 器 环境 的 一 个 重要 目标 。 

。 支持 交互 性 ; 这 对 于 桌面 环境 的 交互 式 负载 来 说 很 重要 。 

。 避免 饥饿 : 以 确保 计算 性 的 负载 不 会 因为 存在 交互 性 负载 而 受到 影响 。 

。 支持 软 实 时 调度 ， 以 满足 带 有 实时 性 要 求 的 交互 式 应 用 程序 的 需求 。 

Linux 对 进程 和 线程 这 两 个 术语 的 使 用 与 它们 传统 的 含义 相 比 稍微 有 点 不 标准 。 因 此 , 我 
们 将 采用 任务 一 词 来 称呼 Linux 的 调度 算法 。 

Linux 的 调度 需 文 持 三 类 任务 : 

。 实 时 先 到 先 服务 

。 实 时 轮转 

。 分 时 的 

调度 器 有 140 个 优先 级 别 。 它 把 0 ~ 99 保留 给 实时 任务 ， 剩 余 的 留 给 分 时 任务 。 数 字 越 
低 ， 表 示 优 先 级 越 高 ; 因此 ， 优 先 级 0 是 系统 中 的 最 高 优先 级 。 调 度 右 采用 实时 先 到 先 服务 
和 实时 轮转 算法 来 处 理 交 互 式 负载 ， 而 用 分 时 算法 来 处 理 计算 性 负载 。 实 时 先 到 先 服 务 任务 
享有 最 高 的 优先 级 。 调 度 需 不 会 抢占 正在 执行 的 实时 先 到 先 服务 任务 ， 除 非 有 个 更 高 优先 级 
的 实时 先 到 先 服务 任务 进入 了 就 绪 队 列 。 实 时 轮转 任务 与 实时 先 到 先 服务 任务 相 比 优先 级 低 
一 些 。 如 同名 字 所 暗示 的 一 样 ， 该 调度 器 给 每 个 轮转 任务 分 配 一 个 时 间 片 。 相 同 优先 级 的 轮 
转 任 务 的 时 间 片 也 相同 ， 而 轮转 任务 的 优先 级 越 高 ， 相 应 的 时 间 片 也 越 长 。 分 时 任务 与 实时 
轮转 任务 相似 ， 只 是 它们 的 优先 级 更 低 一 些 。 

调度 器 的 主要 数据 结构 (参见 图 6-23 ) 是 一 个 运行 队列 。 运 行 队列 包含 两 个 优先 级 数组 。 
一 个 是 活动 数组 ， 一 个 是 期 满 数组 。 每 个 优先 级 数组 都 有 140 项 ， 对 应 于 140 个 优先 级 别 。 
每 一 项 都 指向 该 级 别 的 第 一 个 任务 。 同 级 别 的 任务 则 以 一 个 双向 链表 的 形式 连 在 一 起 。 

调度 算法 很 直观 : 

。 从 活动 数组 中 选择 最 高 优先 级 任务 中 的 第 一 个 来 运行 。 

。 如 果 该 任务 阻塞 了 (由 于 1O)， 那 么 把 它 放 到 一 边 ， 运 行 下 一 个 。 

。 如果 当前 调度 的 任务 的 时 间 片 用 完了 (对 先 到 先 服 务 的 任务 不 适用 )， 把 它 放 进 期 满 数 

组 中 。 
。 如 果 一 个 任务 完成 了 1O， 把 它 放 到 活动 数组 的 相应 优先 级 的 项 目 中 。 调 整 它 的 剩余 时 
间 段 。 

。 如 果 活 动 数 组 中 不 再 有 任务 了 ， 就 交换 活动 和 期 满 数 组 的 指针 ， 继 续 进行 调度 算法 (也 

就 是 说 ， 期 满 数 组 变 成 了 新 的 活动 数组 ， 反 之 亦 然 )。 

前 述 算法 中 第 一 件 应 当 注 意 的 事情 是 ， 优 先 数组 保证 了 调度 器 能 在 常数 时 间 内 做 出 调度 
决定 ， 而 不 依赖 于 系统 中 的 进程 数 。 这 达到 了 我 们 之 前 提 到 的 效率 目标 。 由 于 这 个 原因 ， 该 
调度 器 也 被 称 作 O(1) 调度 器 ， 意 味 着 调度 决定 不 依赖 于 系统 中 的 任务 数 。 

第 二 件 需 要 注意 的 事情 是 ， 调 度 器 通过 实时 先 到 先 服 务 和 实时 轮转 调度 来 给 交互 式 任务 
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以 特殊 处 理 ， 以 满足 软 实时 性 的 要 求 . 


运行 队列 





其 他 东西 
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图 6-23 Linux 调度 的 数据 结构 。140 个 调度 优先 级 中 的 每 一 个 都 有 一 个 双向 链表 。 调 
度 锅 对 活动 数组 中 的 任务 以 分 时 的 方式 进行 调度 ,在 它们 的 时 间 段 用 完 之 后 把 
它们 移动 到 期 满 数组 中 。 而 在 活动 数组 空 下 来 之 后 ， 则 把 “期 满 ” 数 组 变 为 活 
动 的 


我 们 之 前 已 经 说 过 ， 除 了 相对 优先 级 以 外 ， 在 实时 轮转 和 分 时 任务 之 间 没 有 多 少 不 同 点 。 
实际 上 ， 调 度 咒 不 知道 哪些 任务 真 的 是 交互 式 的 。 因 此 ， 它 采用 一 种 启发 式 的 方法 来 根据 执 
行 历史 确定 任务 的 性 质 。 调 度 器 监控 每 个 任务 对 CPU 使 用 的 模式 。 如 果 一 个 任务 经 常 进行 阻 
塞 式 的 O 请求 ， 那 么 它 就 是 一 个 交互 式 任务 (IO 受 限 的 ); 另 一 方面 ， 如 果 一 个 任务 不 怎么 
进行 O, MEEA CPU 密集 的 任务 (CPU ZRA). 

我 们 很 多 人 可 能 都 熟悉 “ 明 葛 卜 加 大 棒 ” 这 一 俗语 ， 它 表示 奖励 好 的 行为 ， 而 惩罚 坏 的 
行为 。 调 度 器 也 是 这 么 做 的 。 通 过 动态 地 提高 调度 优先 级 来 对 交互 式 任务 进行 奖励 ， 同 时 通 
过 动态 降低 调度 优先 级 的 方式 来 惩罚 CPU 密集 型 的 任务 。。 调 度 器 提高 交互 式 任务 的 优先 级 
的 结果 就 是 它 会 得 到 更 多 的 CPU 时 间 ， 从 而 保证 良好 的 啊 应 时 间 。 类 似 地 ， 调 度 器 降低 计算 
受 限 的 任务 的 优先 级 ， 使 得 它 得 到 的 CPU 时 间 与 交互 式 任务 相 比 来 说 较 少 。 

最 后 ， 为 了 满足 关于 饥 饭 的 目标 ， 调 度 关 有 一 个 饥饿 国 值 。 如 果 一 个 任务 没有 得 到 CPU 
使 用 机 会 的 时 间 (由 于 交互 式 任务 得 到 了 更 高 的 优先 级 ) 超过 了 此 装 值 ， 那 么 饥 猴 的 任务 就 会 
在 交互 式 任务 之 前 得 到 CPU 使 用 机 会 。 


历史 回顾 


操作 系统 和 CPU 一样， 都 有 着 多 彩 的 历史 。Microsoft Windows, Mac OS 和 Linux 统治 
着 今日 的 市 场 。 让 我 们 沿 着 历史 书 上 的 旅程 来 看 看 怎么 走 到 了 现在 的 地 方 。 


O 任务 在 创建 时 就 有 静态 优先 级 。 动 态 优 先 级 是 作为 对 好 行为 的 奖励 或 者 对 坏 行 为 的 惩罚 而 对 静态 级 别 的 暂 
时 偏 移 . 
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操作 系统 的 进化 与 处 理 器 的 进化 密 不 可 分 。Charles Babbage (查尔斯 巴 贝 奇 ) ( 1792 一 
1871 ) 建造 了 第 一 台 计 算 机 (他 把 它 称 作 “ 分 析 机 ”)， 而 只 用 到 了 机 械 部 件 : 齿轮 、 滑 轮 和 
轮子 。 和 直到 第 二 次 世界 大 战 为 止 计算 机 都 没有 多 少 其 他 进步 。 虽 然 让 人 伤心 ， 战 争 刺激 技术 
创新 却 是 真 的 。 宾 夕 法 尼 亚 州 立 大 学 的 John Mauchly 和 Presper Echert 在 1944 年 用 真空 管 建 
造 了 ENIAC (Electronic Numerical Integrator and Calculator， 电 子 数字 积分 计算 机 )。 他 们 的 工 
作 是 由 美国 陆军 赞助 的 ， 用 以 进行 破译 德军 密码 的 计算 .ENIAC 和 其 他 该 时 代 (1944 ~ 1955 ) 
的 早期 机 需 主 要 都 用 独占 模式 ， 而 不 需要 任何 操作 系统 。 实 际 上 ， 这 些 早期 计算 的 “程序 ” 
不 过 是 被 设计 成 用 来 反复 进行 特定 计算 的 接线 电路 . 

在 20 世纪 50 年 代 未 出 现 的 采用 固态 电子 硕 件 的 大 型 机 产生 了 我 们 今日 所 知 的 计算 机 器 
的 最 早 形 象 。IBM， 大 型 机 葛 技 场 的 最 早 玩 家 ， 推 出 了 FORTRAN 编程 语言 ， 以 及 可 能 是 第 
一 个 用 来 文 持 它 的 操作 系统 FMS (Fortran Monitoring System, FORTRAN 监控 系统 )。IBM 
后 来 推出 了 IBSYS，IBM 的 IBM 7094 计算 机 的 操作 系统 。 这 是 批 处 理 操 作 系 统 的 年 代 ; 用 
户 以 一 登 打 孔 卡 片 的 形式 提交 他 们 的 作业 。 打 孔 卡 片 包含 一 种 采用 任务 控制 语言 ( JCL，Job 
Control Language) 所 描述 的 程序 所 和 需 资 源 ， 以 及 用 FORTRAN 语言 写 的 程序 本 身 。 作 业 在 计 
算 机 上 一 个 接 者 一 个 运行 ， 并且 需要 不 少 人 类 操作 员 的 手工 操作 来 加 载 程序 所 需 的 磁带 和 磁 
盘 一 类 的 资源 。 用 户 在 一 段 时 间 以 后 再 从 计算 机 上 得 到 程序 的 运行 结果 。 

计算 机 的 早期 岁月 中 有 两 个 明显 不 同 的 用 户 社区 : 科学 的 和 商用 的 。 在 20 世纪 60 年 代 
HHH, IBM 推出 了 360 系列 计算 机 ， 用 以 把 两 个 社区 的 需求 合 二 为 一 。 它 也 推出 了 为 该 系列 
计算 机 所 设计 的 OS/360 操作 系统 。 该 操作 系统 的 最 重要 的 创新 是 多 道 程 序 设计 ， 它 确保 了 系 
统 在 为 某 个 用 户 进 行 VO 的 时 候 ，CPU 可 以 处 理 别 的 进程 。 尽 管 有 多 道 程序 设计 ,但 是 从 外 
部 看 起 来 仍然 是 个 面 回 批 处 理 的 系统 ， 因 为 用 户 在 某 个 时 刻 提 交 任 务 ， 而 之 后 再 来 收集 结果 。 

为 了 分 析 结 果 而 改进 程序 以 及 为 了 调试 ， 产 生 了 对 得 到 提交 的 作业 的 交互 式 响 应 的 淘 望 ， 
而 这 兆 望 就 导致 了 操作 系统 中 的 下 一 场 革 合 ， 即 分 时 。 它 源 目 MIT 在 1962 年 开发 的 CTSS 
( Compatible TimeSharing System, WEDIR), 21T IBM 7094 之 上 。MIT 的 CTSS 的 
一 个 后 续 项 目 是 MULTICS ( MULTiplexed Information and Computer Service， 多 路 信息 和 计算 
机 服务 )， 考 虑 到 那个 时 候 可 用 的 计算 设施 的 简陋 程度 ， 它 在 信息 服务 和 交换 的 概念 这 方面 可 
能 远 远 地 领先 于 时 代 。MULTICS 引入 了 几 个 创新 性 的 操作 系统 概念 ， 涉 及 信息 组 织 、 共 享 、 
保护 、 安 全 和 隐私 ， 影 响 持 续 到 今日 。 

MULTICS 是 1974 年 由 Dennis Ritchie 和 Ken Thompson 于 贝尔 实验 室 开 发 的 UNIX 操作 
系统 开发 的 种 子 。 他 们 把 该 系统 命名 为 UNIX， 以 体现 他 们 希望 开发 一 个 精简 的 单 用 户 版 本 
的 MULTICS 的 意图 。UNIX 9 立刻 在 教育 机 构 、 政 府 实验 室 和 诸如 DEC、HP 等 公司 中 流行 
起 来 。 从 UNIX 间接 发 展 出 Linux 这 件 事 情 也 是 个 有 趣 的 故事 。 随 着 UNIX 的 流行 以 及 它 被 
不 同 实体 的 广泛 改编 ， 很 快 出 现 了 该 操作 系统 的 几 个 不 兼容 的 版 本 。 在 1987 年 ，Vrije 大 学 
的 Andrew Tannenbaum 9S 开发 了 MINIX， 作 为 UNIX 的 一 个 小 克隆 ， 以 用 于 教学 目的 。Linus 
Torvalds 从 MINIX 出 发 开始 编写 Linux， 作 为 UNIX 的 一 个 免费 产品 版 本 ， 很 快 由 于 GNU 基 
金 会 提倡 的 开放 软件 模式 ， 而 开始 了 它 自 己 的 生涯 。 虽 然 有 这 些 不 同 的 基于 UNIX 的 系统 的 
故事 ， 有 一 件 东 西 还 是 一 样 的 ， 也 就 是 这 些 不 同 风格 的 UNIX 背后 的 操作 系统 概念 。 

日 ” 它 一 开始 被 命名 为 UNICS ( Uniplexed Information and Computer Service， 单 路 信息 和 计算 机 服务 )， 后 来 改 


名 为 UNIX; 
昌 ” 很 多 本 著名 操作 系统 和 体系 结构 教材 的 作者 。 


前 面 提 到 的 所 有 操作 系统 都 是 为 了 支持 大 型 机 和 小 型 机 而 在 不 断 演进 。 与 这 种 进化 平行 
的 是 微型 计算 机 进入 市 场 ， 逐 渐 地 改变 了 计算 设施 和 使 用 模型 。 计 算 机 不 再 一 定 是 像 大 型 机 
和 小 型 机 通常 意味 的 那样 是 个 共享 资源 。 相 反 ， 它 是 个 人 计算 机 (PC)， 用 来 给 一 个 用 户 独 
占 使 用 。 在 20 世纪 70 年 代 ， 开 始 有 早期 的 微型 计算 机 ， 它 们 采用 Intel 8080/8085 单 芯片 处 
理 需 。 这 样 的 个 人 计算 机 应 当 有 什么 样 的 操作 系统 呢 ? 一 种 简单 的 操作 系统 ， 被 称 作 CP/M 
(Control Program Monitor， 控 制程 序 监 控 器 ) 是 这 些微 机 的 行业 标准 。 

IBM 在 20 世纪 80 年 代 早 期 开发 出 了 IBM PC。 一 个 叫做 微软 的 小 公司 为 IBM 公司 提供 
了 一 个 操作 系统 ， 称 作 MS-DOS. MS-DOS 的 早期 版 本 和 CP/M 有 着 惊人 的 相似 处 ,但 是 有 
着 简化 的 文件 系统 ， 并 可 提供 更 高 的 性 能 。 有 了 IBM 这 样 的 工业 巨人 的 庇佑 ，MS-DOS 很 快 
占领 了 PC 市 场 ， 把 CP/M 赶 到 了 二 线 。 一 开始 ， 由 于 PC 的 预 其 用途 ，MS-DOS 的 功能 相当 
原始 。 但 是 它 缓 慢 地 开始 加 入 来 自 UNIX 系统 的 多 任务 和 分 时 的 想法 。 值 得 一 提 的 是 ， 虽 然 
MS-DOS 是 从 一 个 小 的 轻型 操作 系统 开始 演化 ， 逐 渐 加 入 来 目 UNIX 操作 系统 的 想法 ， 而 苹 
果 的 Mac OS X 同样 针对 PC (苹果 的 Macintosh 系列 )， 则 是 UNIX 操作 系统 的 直接 后 裔 。 

苹果 在 Mac 计算 机 中 采用 了 图 形 用 户 界 面 (GUI，Graphical User Interface) 以 后 ， 微 软 
紧 随 其 后 ， 在 MS-DOS 之 上 提供 Windows， 作 为 用 户 与 PC 交互 的 方式 。 早 期 的 Windows 是 
MS-DOS 之 上 的 一 层 包 装 ， 直 到 1995 年 微软 推出 Windows 95， 之 后 推出 Windows NT (NT 
表示 New Technology， 即 新 技术 )、Windows NT 4.0, Windows 2000, Windows XP, Windows 
Vista， 再 到 Windows 7 (截止 到 2009 年 )。 但是， 操作 系统 中 的 核心 抽象 层面 的 基本 概念 在 
版 本 的 更 适中 变化 不 大 。 如 果 说 有 变化 的 话 ， 那 么 就 是 这 些 概 念 成 熟 到 了 与 UNIX 操作 系统 
中 的 那些 难以 区 分 的 程度 。 类 似 地 ， 基 于 UNIX 的 系统 也 吸收 和 加 入 了 源 自 PC 世界 的 图 形 
用 户 界 面 的 想法 。 


练习 题 


1. 对 比 进 程 和 程序 的 异同 。 

2. 进程 的 状态 包括 哪些 东西 ? 

3. 在 分 时 环境 中 哪个 指标 最 为 用 户 中 心 ? 

4. 考虑 一 个 抢占 式 的 优先 级 处 理 器 调度 器 。 要 执行 的 作业 包含 有 三 个 进程 ，P1、P2 和 了 P3。 人 它们 具有 以 


下 特点 : 

进程 ” 到 达 时 间 优先 级 ”活动 

Pl 0 Æ 1 8 秒 的 CPU 突 发 ， 然 后 
4 秒 的 IO 突 发 ， 然 后 
6 秒 的 CPU 突 发 后 退出 

P2 2 秒 3 64 FAY CPU 突 发 后 退出 

P3 4 秒 2 2 秒 的 CPU 突 发 ， 然 后 


2 秒 的 IO 突 发 ， 然 后 

2 秒 的 CPU 突 发 ， 然 后 

2 秒 的 IO 突 发 ， 然 后 

2 秒 的 CPU 突 发 ， 然 后 

2 秒 的 IO 突 发 ， 然 后 

2 秒 的 CPU 突 发 后 退出 
Pl, P2 和 P3 的 平均 周转 时 间 分 别 是 多 少 ? 


N 
N 
WN 


276 


186 BOE 


这 组 作业 的 平均 等 待 时 间 是 多 少 ? 
先 到 先 服务 的 CPU 调度 策略 有 何 缺 点 ? 
.解释 先 到 先 服务 调度 策略 中 发 生 的 护送 效应 。 
. 先 到 先 服 务 调度 的 好 处 是 什么 ? 
. 依据 以 下 标准 讨论 不 同 的 调度 算法 : 

(a) 等 待 时 间 

(b) 饥饿 

(e) 周转 时 间 

(d) 周转 时 间 的 方差 

哪个 调度 算法 以 周转 时 间 的 方差 大 而 著称 ? 
9. 是 不 是 任何 一 个 调度 算法 都 能 改 成 抢占 式 的 ?什么 样 的 算法 特性 会 使 它 适合 抢占 式 的 调度 ? 需要 处 理 

催 体 系 结构 为 允许 抢占 进行 怎样 的 支持 ? 
10. 总 结 处 理 咒 调度 为 处 理 需 体系 结构 带 来 的 增强 。 


oo >~1 人 ww 


11. 考虑 以 下 进程 ,按照 顺序 到 达 : 
CPU 突 发 时 间 IO 突 发 时 间 
Pl 3 2 
P2 4 3 
P3 8 4 


分 别 采用 先 到 先 服务 、 最 短 作 业 优 先 和 轮转 算法 ， WARA A VO 的 活动 情况 。 
12. 用 最 短 作 业 优先 和 轮转 (时 间 片 =2 ) 重 做 例 6-1. 
13. 用 先 到 先 服 务 和 轮转 (时 间 片 =2 ) 重 做 例 6-3. 


参考 文献 注释 和 扩展 阅读 


Bobrow 等 人 所 写 的 分 时 操作 系统 的 经 典 论文 [Bobrow，1972] 对 早期 商用 操作 系统 如 DEC 公司 
的 TOPS-20 的 设计 有 着 重大 影响 。 那 些 年 里 ， 其 他 有 影响 力 的 操作 系统 包括 DEC 的 VAX/VMX 操作 系 
统 ， 以 及 IBM 的 OS/360。 关 于 Unix 的 原始 论文 发 表 在 1974 年 [Ritchie，1974]。 处 理 右 调度 的 话题 有 
几 本 教材 讲 得 很 好 [Silverschatz, 2008 ; Tanenbaum，2007]。 要 了 解 Linux 中 CPU 调度 的 细节 ，Bovet 
和 Cesati 写 的 书 是 个 很 好 的 资源 [Bovet，2005]。 很 多 操作 系统 教材 [Silberschatz, 2008 ; Tanenbaum, 
2007] 包括 了 对 几 个 曾经 有 影响 力 的 操作 系统 的 案例 研究 ， 也 包括 诸如 Linux, Windows XP 和 Symbian 
OS 之 类 的 现代 系统 。Foster 和 Kesselman 写 的 书 [Foster, 2003] 是 个 学 习 网 格 计算 中 的 开发 的 很 好 资源 。 
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让 我 们 回顾 一 下 已 经 了 解 了 哪些 东西 。 在 硬件 方面 ,我 们 看 到 了 处 理 器 指令 集 、 中 断 ， 
以 及 处 理 融 的 设计 。 而 在 软件 方面 ， 我 们 看 到 了 如 何 把 处 理 器 当 作 一 种 资源 ， 调 度 它 来 运行 
不 同 的 程序 。 我 们 已 经 熟悉 的 软件 实体 包括 位 于 操作 系统 之 上 的 编译 器 和 链接 器 ， 以 及 位 于 
操作 系统 之 中 的 加 载 器 和 进程 调度 器 。 

现在 ， 我 们 和 硕 望 我 们 已 经 对 “盒子 ”中 的 魔法 般 的 某 些 东西 进行 了 揭秘 。 在 本 章 中 ,我 
们 把 视角 放 在 计算 机 系统 的 另 一 个 重要 组 成 部 分 ， 即 内 存 ， 以 继续 我 们 揭秘 这 个 “盒子 ”的 
过 程 。 

内 存 系统 中 的 人 硬件 和 系统 软件 之 间 的 相互 联系 比 其 他 任何 子 系 统 都 要 强 。 在 描述 内 存 系 
统 的 菏 个 软件 方面 的 时 候 ， 经 常 没 法 不 同时 提 一 提 相 应 的 硬件 支持 。 我 们 用 包括 本 章 在 内 的 
3 草 来 讲 内 存 系统 。 本 章 主 要 讲 操作 系统 管理 内 存 的 不 同 策略 ， 以 及 必需 的 体系 结构 支持 。 
在 第 8 章 中 ,我 们 深入 讨论 基于 页 机 制 的 内 存 系统 的 细节 ， 尤 其 是 页 替换 策略 。 最 后 在 第 9 
音 ， 我 们 讨论 内 存 层 次 结构 ， 尤 其 是 缓存 以 及 主 存 ， 即 物理 内 存 。 


7.1 内 存 管 理 器 提供 的 功能 

让 我 们 来 了 解 一 下 什么 是 内 存 管理 。 为 了 加 以 区 分 ， 我 们 需要 指出 本 书 中 所 说 的 内 存 管 
理 和 Java, CH 等 编程 语言 中 的 自动 内 存 管理 是 不 同 的 。 这 些 编程 语言 的 运行 时 系统 会 自动 释 
放 程 序 未 使 用 的 内 存 。 垃 圾 回收 是 这 个 功能 的 另 一 个 称呼 。 有 一 些 垃圾 回收 器 里 的 技术 与 操 
作 系 统 内 存 管理 里 的 方法 类 似 。 关 于 这 两 者 的 异同 点 的 讨论 超出 了 本 书 的 范畴 。 如 果 读 者 对 
垃圾 回收 有 兴趣 ， 可 以 参考 其 他 资料 学 习 [Jones, 1996]. 

在 本 书 中 ,我 们 将 重点 放 在 操作 系统 如 何 管理 内 存 上 。 如 处 理 带 一 样 ， 内 存 也 是 一 种 珍 
贯 的 资源 ， 而 操作 系统 则 负责 确保 它 的 有 效 利 用 。 内 存 管理 是 操作 系统 里 的 一 个 部 分 ， 它 提 
供 以 下 功能 。 

1 ) 提高 资源 利用 率 ”因为 内 存 是 一 种 稀缺 资源 ， 它 最 好 能 做 到 按 需 分 配 。 我 们 可 以 把 它 
类 比 成 办 公 室 的 空间 。 系 里 的 每 个 教师 都 可 以 给 实验 室 和 他 的 学 生 申 请 若干 空间 。 系 主任 可 
能 没有 办 法 一 次 性 就 把 教师 申请 的 空间 分 配给 他 ， 但 是 可 以 随 着 教师 学 生 数 的 增加 而 逐渐 给 
他 增加 空间 。 类 似 地 ， 尽 管 程序 的 内 存 印迹 包括 了 推 ， 却 没有 必要 在 程序 局 动 的 时 候 就 把 堆 
空间 分 配给 它 ， 而 只 需要 在 程序 动态 地 申请 的 时 候 给 它 分配 就 行 了 。 如 果 一 个 教师 的 小 组 缩 
小 了 ， 那 么 他 不 再 需要 分 配 到 的 所 有 空间 ， 系 主任 就 会 收回 一 部 分 空间 ， 分 给 其 他 更 需要 空 
间 的 教师 。 类 似 地 ， 如 果 一 个 进程 没有 主动 使 用 分 配给 它 的 空间 ， 也 许 最 好 就 应 该 把 它 的 空 
间 释 放 掉 ， 给 其 他 需要 空间 的 进程 使 用 。 渐 进 式 分 配 内 存 和 动态 分 配 两 个 点 子 都 可 以 改进 内 
存 的 利用 率 。 我 们 用 一 个 简单 的 图 示 来 表示 合理 分 配 内 存 资源 的 重要 性 。 下 图 左 侧 的 部 分 是 
一 个 笔记 本 电脑 上 的 任务 管理 器 的 截图 ， 显 示 了 它 实 际 在 运行 的 应 用 程序 列表 。 而 右 侧 部 分 


O 在 第 5 章 和 第 6 章 中 ,我 们 用 术语 内 存 印 迹 来 表示 程序 在 载 和 时 所 占用 的 静态 空间 。 在 第 7 章 和 第 8 章 ， 
我 们 则 把 内 存 印 迹 的 定义 扩展 为 包括 程序 执行 时 在 堆 里 动态 分 配 的 空间 ， 
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显示 了 该 笔记 本 电脑 上 实际 运行 的 进程 列表 的 很 小 一 部 分 。 一 共有 4 个 应 用 程序 在 运行 ,但 
是 却 有 123 个 进程 ! 我 们 展示 这 张 图 是 希望 指出 ， 在 用 户 运 行 的 进程 以 外 ， 操 作 系 统 和 其 他 
实用 程序 会 产生 很 多 后 台 进 程 ( 常 被 称 作 守 护 进程 )。 因 此 ， 在 任何 时 候 ， het 
统 产生 的 需求 都 是 很 大 的 。 例 子 中 的 笔记 本 电脑 有 2GB 内 存 ， 其 中 58% 在 使 用 中 ， 尽 管 只 
有 4 个 应 用 程序 在 运行 。 
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2) 独立 性 和 保护 ”我们 提 到 过 ， 内 存 里 任何 时 候 都 同时 驻 留 着 多 个 进程 。 某 程序 可 能 会 
包含 bag， 以 至 于 失控 地 写 人 到 不 属于 它 的 内 存 印迹 的 内 存 区 域 去 。 防 止 有 bug 的 进程 碰 到 
它 自己 和 其 他 进程 是 明智 的 。 进 一 步 说 ， 在 现今 计算 机 病毒 和 蠕虫 肆 虐 的 时 代 ， 亚 意 程序 可 
能 有 意 尝 试 破坏 其 他 正常 程序 的 内 和 存 。 因 此 ， 内 存 管 理 需 为 进程 提供 独立 性 ， 并 且 在 它们 之 
间 提 供 保护 。 我 们 再 考虑 一 下 空间 的 类 比 ， 如 果 你 在 有 兄弟 姐妹 的 家 庭 中 长 大 ， 很 可 能 就 能 
联想 到 对 独立 性 和 保护 的 需要 。 你 要 么 已 经 有 ， 要 么 是 想 有 一 个 你 上 自己 的 房间 ， 在 你 不 想 让 
WRR (AREE) 进来 的 时 候 可 以 锁 起 门 来 ! 

3) 从 资源 限制 中 解放 ” 当 一 个 教师 被 雇用 了 ， 系 主任 可 能 会 许诺 他 想 要 多 少 空间 就 有 
多 少 空间 ， 说 不 定 比 整个 系 现 有 的 未 占用 空间 还 要 多 。 这 就 给 了 新 老师 计划 建立 和 扩展 研究 
计划 与 学 生 团队 的 自由 。 类 似 地 ， 对 程序 员 来 说 理想 情况 是 开发 程序 的 时 候 不 用 担心 物理 内 
存 的 总 量 。 想 象 一 下 一 个 有 10 个 学 生 的 教师 ， Sone tom ! 能 放下 5 个 人 。 学 生 可 能 只 能 
PPLE, HERS. RMH, al 下 你 要 写 一 个 多 玩家 的 视频 游戏 ， 而 经 理 说 你 总 共 

只 能 使 用 10KB 的 内 存 。 比 如 说 你 的 re ert x 间 远 超 过 给 定 的 
10KB。 那 么 你 作为 程序 员 Eagle 和 并 以 一 种 分 时 共享 的 
方式 使 用 内 存 装 下 它们 (本质 上 来 说 ,就 是 把 这 些 数据 结构 分 多 层 放 在 内 存 里 )。 如 果 被 迫 这 
么 做 的 话 ， 程 序 就 会 变 得 很 丑 。 为 了 解决 这 个 问题 ， 内 存 管理 软件 和 体系 结构 协同 工作 ， 设 
计 出 一 种 机 制 ， 给 程序 员 以 拥有 很 大 内 存 的 假象 。 实 际 物理 内 存 可 能 比 程序 员 看 到 的 假想 中 
的 内 存 小 得 多 。 

4 ) 并 发 进程 共享 内 存 ”你 可 能 大 部 分 时 候 都 想 把 兄弟 姐妹 关 在 门 外 , 但 是 偶尔 你 也 会 希 
望 他 们 进入 你 房间 ， 也 许 是 来 玩 视 频 游 戏 。 类 似 地 ， 尽 管 进程 间 的 内 存 保护 是 必要 的 ， 进 程 
有 时 候 也 许 会 想 共 享 内 存 ， 既 可 以 是 隐 式 的 也 可 能 是 显 式 的 。 比 如 说 ， 你 可 能 在 桌面 上 打开 

a cea 每 个 可 能 在 访问 不 同 的 网 页 ， 但 是 如 果 它 们 都 在 运行 同一 个 浏览 硕 应 用 

它们 就 在 共享 代码 。 这 是 进程 间 隐 式 共 享 的 例子 。 把 一 张 图 片 从 一 个 幻灯 片 程序 拷贝 
et eer 

前 面 提 到 的 所 有 功能 都 有 各 自 的 成 本 。 特 别 是 ， 我 们 在 引入 CPU 和 内 存 之 间 的 一 个 代 
理 ， 如 图 7-1 所 示 。 该 代理 是 一 块 硬件 ， 提 供 实 现 内 存 管理 策略 所 需 的 机 制 。 原 则 上 说 ， 它 


把 CPU 生成 的 (逻辑 ) 内 存 地 址 映射 到 实际 内 存 地 址 以 便 访 存 。 代 理 的 复杂 程度 取决 于 内 存 
管理 器 的 功能 ， 

1S Aik. 我 们 还 没有 在 LC-2200 中 引入 这 样 的 功能 。 但 是 ， 既 然 我 们 有 野心 ， 想 让 LC- 
2200 在 从 游戏 机 到 高 性 能 计算 机 的 各 种 设备 
中 称霸 全 世界 ， 这 种 功能 显然 必 不 可 少 。 

一 个 好 的 内 存 管理 器 有 三 重 目标 。 它 
y: 

1 ) 需要 尽量 少 的 硬件 支持 ; 

2 ) 对 内 存 访问 的 影响 尽量 小 ; 

3 ) 让 内 存 管理 的 额外 开销 小 ( 指 的 是 
内 存 的 申请 和 释放 )。 


7.2 内 存 管理 的 简单 方案 


在 本 市 中 ， 让 我 们 考虑 一 些 内 存 管 理 的 人 简单 方案 ， 以 及 所 需 的 对 应 的 硬件 支持 。 本 节 本 
着 共同 探索 的 精神 ,讨论 如 何 达 到 之 前 提 到 的 目标 ， 同 时 也 实现 上 节 提 到 的 功能 。 前 两 个 方 
案 和 对 应 的 硬件 支持 (栅栏 寄存 器 和 界限 寄存 器 ) 只 是 为 了 说 明 目 的 而 提出 ， 我 们 不 知道 有 任 
何 机 器 体系 结构 用 到 了 这 样 的 方案 。 而 第 三 个 方案 ( 基 址 寄存 器 和 限 长 寄存 器 ) 则 在 多 种 体系 
结构 中 被 广泛 采用 ,包括 CDC 6600 (第 一 台 超 级 计算 机 ) 以 及 IBM 360 系列 。 这 三 个 方案 在 
达到 前 一 节 所 提出 的 功能 需求 方面 都 有 欠缺 之 处 ， 因 此 催生 了 现代 体系 结构 中 为 更 加 复杂 的 
内 存 管 理 机 制 ， 即 分 页 和 分 段 。 

1 ) 用 户 和 内 核 的 分 隔 ”考虑 一 个 非常 简单 的 内 存 管理 方案 。 我 们 之 前 已 经 看 到 ， 操 作 系 
统 和 用 户 程序 共享 所 有 可 用 的 内 存 空间 。 操 作 系统 所 用 的 空间 是 内 核 空间 ， 而 用 户 程序 所 用 
的 则 是 用 户 空间 。 作 为 一 种 近似 ， 我 们 希望 确保 两 种 空间 之 间 有 一 个 分 界线 ， 从 而 用 户 程序 
不 会 跨 进 操作 系统 的 内 存 空 间 里 去 。 图 7-2 展示 了 一 个 用 以 实现 这 种 分 隔 的 简单 机 制 。 图 中 
的 阴影 部 分 对 应 着 图 7-1 中 内 存 代理 所 做 的 工作 。 该 方案 用 到 了 三 个 体系 结构 元 素 : 一 个 模 
式 位 用 来 表示 程序 是 在 用 户 还 是 内 核 模 式 ， 一 条 特权 指令 用 来 翻转 该 位 ， 以 及 一 个 栅栏 寄存 
器 。 你 可 以 想象 ， 该 寄存 器 的 名 字 来 源 于 对 保护 财产 的 物理 意义 上 的 栅栏 的 类 比 。 内 存 管 理 
器 在 调度 用 户 程序 时 设置 栅栏 寄存 器 。 硬 件 通过 把 访 存 地 址 与 栅栏 寄存 器 做 对 比 来 验证 处 理 
器 产生 的 内 存 地 址 的 有 效 性 。 这 个 简单 的 硬件 机 制 为 用 户 程序 和 内 核 之 间 提 供 了 内 存 保护 。 


z 





图 7-1 APSR AN. PAAR PS ITT A 
像 是 CPU 生成 的 地 址 和 内 存 之 间 的 代理 





陷 人 
图 7-2 ”栅栏 寄存 器 。 使 得 用 户 程序 只 能 访问 高 于 栅栏 寄存 器 所 指定 的 内 存 地 址 


举例 来 说 ， 假 设 栅栏 寄存 器 被 设置 为 10000。 这 就 意味 着 内 核 占据 着 0 ~ 10000 的 内 存 区 
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域 。 如 果 CPU 在 用 户 模 式 中 产生 的 地 址 高 于 10000, 硬件 就 认为 它 是 合法 的 用 户 程 序 地 址 。 
任何 小 于 或 等 于 10000 的 地 址 都 是 内 核 地 址 ， 从 而 会 产生 访问 违例 的 陷入 。CPU 必须 在 内 核 
模式 里 才能 访问 内 核 内 存 区 域 。 为 了 理解 CPU 是 怎么 进入 内 核 模式 的 ， 回 忆 一 下 第 4 章 中 从 
绍 的 陷入 的 概念 ,一 个 同步 的 程序 不 连续 性 ,通常 是 由 希望 进行 系统 调用 (比如 读 取 文 件 ) 的 
程序 引发 的 。 这 样 的 陷入 会 导致 处 理 絮 自动 进入 内 核 模 块 ， 这 是 陷入 指令 实现 的 一 部 分 。 因 
Ik, CPU 隐 式 地 在 系统 调用 里 进入 内 核 模 式 ， 并 且 此 时 就 可 以 访问 为 内 核 所 保留 的 内 存 区 域 
了 。 当 操作 系统 完成 系统 调用 ， 它 可 以 通过 体系 结构 提供 的 特权 指令 显 式 地 返回 用 户 模式 。 
这 条 指令 是 特权 指令 是 因为 它 仅 限于 在 内 核 模 式 里 使 用 。 任 何在 用 户 模 式 中 执行 该 指令 的 尝 
试 都 会 引发 异常 ， 男 一 种 同步 程序 不 连续 性 (我 们 也 在 第 4 章 介 绍 过 了 )， 由 用 户 程序 的 非法 
操作 引起 。 你 也 许 已 经 猜 到 了 ， 回 栅栏 寄存 顺 进 行 写 信也 是 一 条 特权 指令 -。 

2) 静态 重 定位 ”之 前 已 经 讨论 过 ， 我们 希望 多 个 用 户 程 序 可 以 同时 在 内 存 中 共存 。 因 
此 ， 内 存 管 理 带 应 当 保 护 共存 的 进程 ， 防 止 它 们 互相 影响 。 图 7-3 展示 了 实现 该 保护 的 人 硬件 
机 制 。 图 中 阴影 部 分 仍然 是 表示 图 7-1 中 的 内 存 代 理 所 完 成 的 工作 的 硬件 部 分 。 










CPU 生成 SQV 


的 地 址 


和 入 陷入 
图 7-3 ”界限 寄存 器 。 使 得 用 户 程 序 只 能 访问 在 下 限 和 上 限 寄 存 硕 的 值 之 间 的 内 存 地 址 


静态 重 定 位 指 的 是 一 个 进程 的 内 存 界限 在 链接 并 创建 可 执行 程序 的 时 候 被 设 定 。 当 可 执 
行文 件 创建 好 之 后 ， 在 程序 执行 过 程 中 内 存 地 址 就 不 能 改变 了 。 为 了 支持 进程 的 内 存 保护 ， 
体系 结构 提供 两 个 寄存 器 : 上 限 和 下 限 。 界 限 寄 存 器 是 进程 控制 块 (也 就 是 PCB ， 在 第 6 章 
介绍 过 ) 的 一 部 分 。 向 界限 寄存 器 中 进行 写 人 是 体系 结构 提供 的 特权 指令 。 内 存 管理 器 在 分 
发 进程 的 时 候 把 PCB 中 的 值 设 置 进 界限 寄存 器 中 - (关于 如 何在 CPU 上 调度 进程 ， 参 见 第 6 
章 。) 在 链接 时 ， 链 接 器 为 特定 进程 分 配 一 个 特定 的 内 存 区 域 95。 加 载 器 在 加 载 的 时 候 把 下 限 
和 上 限 寄存 器 的 值 确 定 下 来 ， 之 后 在 程序 执行 过 程 中 再 也 不 更 改 它 们 。 假 设 链接 需 为 Pl 分 配 
了 地 址 范围 10001 ~ 14000。 在 这 种 情况 下 ， 调 度 咒 会 把 下 限 和 上 限 寄存 需 分 别 设置 为 10000 
和 14001。 从 而 在 Pl 执行 的 时 候 ， 如 果 CPU 生成 的 内 存 地 址 在 10001 ~ 14000 之 间 的 话 硬 
件 就 会 允许 该 访问 ， 而 如 果 越 出 该 界限 的 话 就 会 产生 一 次 访问 违例 陷入 。 

我 们 在 第 6 章 中 提 及 过 替换 的 概念 。 把 一 个 进程 蔡 换 走 是 指 将 一 个 非 活动 进程 (比如 说 ， 
在 等 待 IO 完成 的 进程 ) 从 内 存 里 移动 到 磁盘 上 。 内 存 管 理 器 这 么 做 是 想 把 原本 被 非 活 动 进 程 
占据 的 内 存 空 间 分 配给 其 他 活动 进程 来 有 效 利 用 。 类 似 地 ， 在 一 个 进程 再 次 成 为 活动 进程 时 


O ”注意 现代 操作 系统 采用 的 是 动态 链接 ， 其 中 给 进程 选择 地 址 的 决定 会 推迟 到 载 和 人 进程 的 时 候 来 进行 。 动 态 


链接 器 在 选择 新 进程 的 界限 的 时 候 便 可 以 考虑 当前 内 存 的 使 用 状况 : 
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(比如 说 ， 它 的 IO 请 求 完 成 了 )， 内 存 管 理 器 会 把 该 进程 从 磁盘 替换 入 内 存 (在 确保 所 需 内 存 
分 配给 将 要 替换 和 内存 的 进程 之 后 )。 

考虑 在 有 静态 重 定位 支持 时 把 一 个 进程 从 磁盘 替换 入 内 存 。 由 于 界限 是 确定 的 ， 内 存 管 
理 器 会 把 替换 出 的 进程 放 进 内 存 里 和 原来 完全 一 样 的 位 置 中 。 如 果 该 内 存 空 间 已 经 被 其 他 进 
程 使 用 了 ， 那 么 被 奉 换 出 的 进程 此 时 将 无 法 被 加 载 到 内 存 ， 这 就 是 静态 重 定位 的 主要 缺点 。 

现实 中 ， 编 译 器 生成 代码 时 会 假设 程序 会 驻 留 在 内 存 的 某 个 已 知 的 位 置 85。 因 此 ， 如 果 
操作 系统 不 能 对 此 假设 做 出 更 正 的 话 ， 进 程 本 质 上 来 说 就 是 不 可 重 定 位 的 。 如 果 一 个 进程 的 
地 址 在 加 载 内 存 和 执行 时 均 不 能 改变 ， 我 们 把 它 称 作 不 可 重 定位 的 。 我 们 用 静态 重 命 名 这 
一 名 称 来 称呼 在 进程 加 载 时 定位 到 与 编译 时 不 同 的 位 置 上 的 技术 。 也 就 是 说 ， 程 序 中 用 到 的 
地 址 在 程序 载 作 内存 时 就 确定 下 来 ( 即 固定 )， 在 执行 过 程 中 不 再 变更 。IBM 在 它们 20 世纪 ”L283 
60 年 代 早 期 的 大 型 机 中 采用 了 这 种 静态 重 定位 的 一 个 版 本 。 在 把 进程 加 载 进 内 存 时 ， 加 载 
需 会 在 内 存 中 检查 哪些 地 方 未 被 使 用 ， 并 决定 把 进程 放 在 哪里 。 然 后 它 会 “修复 ”可 执行 程 
序 中 的 所 有 地 址 ， 以 使 得 程序 可 以 在 它 的 新 家 中 正 篆 工作 。 人 例如， 如果 原始 程序 占据 了 地 址 
0 ~ 1000， 加 载 器 决定 把 程序 放 在 地 址 15000 和 16000 之 间 。 这 种 情况 下 ， 加 载 器 就 会 在 加 
载 程序 时 各 程序 中 的 每 处 地 址 上 加 上 15000。 可 以 想象 ， 这 是 个 非常 笨重 费力 的 工作 。 加 载 
右 知 道 可 执行 程序 的 布局 ， 因 此 它 知 道 常 数值 和 地 址 之 间 的 不 同 之 处 ， 因 此 可 以 进行 这 种 修 
补 工 作 。 

3) 动态 重 定位 ”静态 重 定位 对 内 存 管理 有 着 太 多 约束 ， 并 且 导 致 内 存 利用 率 低下 。 这 是 
因为 在 创建 之 后 ， 可 执行 程序 就 在 内 存 中 占据 痢 一 个 固定 区 域 。 两 个 完全 不 同 的 程序 如 果 碰 
巧 有 着 相同 的 或 者 重 芭 的 内 存 界限 ， 就 不 能 在 内 存 中 共存 ， 哪 怕 内 存 中 当前 还 有 其 他 未 被 占 
用 的 区 域 。 这 就 好 比 两 个 小 孩 争 抢 同 一 个 玩具 ， 尽 管 其 实 有 很 多 其 他 玩具 可 以 玩 一 样 ! 这 不 
是 我 们 想 要 的 情况 。 动 态 重 定位 就 是 指 能 够 把 可 执行 程序 加 载 到 内 存 中 任意 能 装 得 下 该 进程 
的 区 域 。 让 我 们 来 看 看 这 与 静态 重 定位 有 什么 不 同 。 有 了 动态 重 定位 ， 程 序 生 成 的 内 存 地 址 
可 以 在 程序 执行 的 过 程 中 被 改变 。 这 就 意味 着 在 把 程序 加 载 到 内 存 的 时 候 ， 操 作 系 统 可 以 根 
据 当 前 内 存 使 用 情况 来 决定 把 程序 放 在 哪里 。 根 据 之 前 关于 静态 重 定 位 的 讨论 ， 你 可 能 会 认 
为 这 就 是 动态 链接 器 让 我 们 做 的 事情 。 但 是 ， 这 里 的 区 别 是 有 了 动态 重 定位 ， 如 果 进 程 被 蔡 
换 出 内 存 了 ， 当 它 之 后 被 换 回 内 存 时 它 不 一 定 必须 回 到 之 前 它 待 过 的 位 置 。 静 态 重 定位 时 程 
序 中 产生 的 地 址 在 执行 中 是 固定 的 ， 而 用 了 动态 重 定位 以 后 可 以 在 执行 过 程 中 改变 它们 。 

现在 需要 找 出 动态 重 定位 所 需 的 体系 结构 支持 。 让 我 们 尝试 一 种 略微 不 同 的 硬件 机 制 ， 

如 图 7-4 所 示 。 和 之 前 一 样 ， 图 中 阴影 部 分 表示 图 7-1 中 内 存 代 理 所 完 成 的 工作 的 人 硬件 部 分 。 
体系 结构 提供 两 个 寄存 器 : 基 址 寄存 器 和 限 长 寄存 器 。CPU 产生 的 地 址 总 是 被 加 上 基 址 寄存 
器 的 值 。 由 于 这 个 偏 移 操作 合理 地 发 生 在 程序 执行 时 ， 这 种 体系 结构 的 增强 就 达到 了 动态 重 
定位 的 需求 。 和 在 静态 重 定 位 中 一 样 ， 这 两 个 寄存 器 是 每 个 进程 的 PCB 的 一 部 分 。 每 次 一 
个 进程 被 加 载 到 内 存 ( 既 可 能 是 加 载 程序 也 可 能 是 替换 入 程序 )， 加 载 器 都 为 该 进程 给 基 址 
寄存 器 和 限 长 寄存 器 分 配 好 值 。 内 存 管 理 器 则 将 这 些 加 载 器 分 配 的 数值 写 人 PCB 中 该 进程 
的 相应 字段 中 。 类 似 于 静态 重 定位 中 的 界限 寄存 器 ， 向 基 址 寄存 器 和 限 长 寄存 器 写 人 是 体系 
结构 提供 的 一 个 特权 指令 。 当 内 存 管理 器 分 发 一 个 特定 进程 时 ， 它 将 基 址 和 限 长 寄存 器 的 值 
设 为 该 进程 的 PCB 中 的 值 。 假 设 P1 的 内 存 印迹 是 4000。 如 果 加 载 器 给 Pl 分 配 的 内 存 范 围 


”在 大 部 分 现代 编译 器 中 ， 程 序 从 地 址 0 开始 ， 直 到 某 个 系统 指定 的 最 大 地 址 为 止 。 


ER 


是 10001 ~ 14000, 那么 内 存 管理 器 就 会 在 Pl 的 PCB 中 向 基 址 寄存 器 赋值 10001， 而 向 限 
长 寄存 器 赋值 14001, AE, Æ P1 执行 时 ， 任 何 CPU 产生 的 地 址 都 会 自动 被 硬件 向 上 偏 移 
10000。 只 要 偏 移 之 后 的 结果 小 于 界限 寄存 器 里 的 值 ， 硬 件 就 认为 该 次 访问 合法 ， 人 允许 该 次 访 
问 。 任 何 超出 限 长 寄存 器 的 值 都 会 导致 访问 违例 陷 人 。 读 者 应 当 能 够 确信 动态 重 定 位 会 得 到 
比 静 态 重 定位 更 好 的 内 存 利 用 率 。 





图 7-4 基 址 和 限 长 寄存 器 。CPU 生成 的 地 址 被 偶 移 基 址 寄存 需 所 指定 的 数值 移动 ， 而 限 
长 寄存 器 则 用 作 当 前 进程 所 能 访问 的 内 存 地 址 上 限 


我 们 为 静态 和 动态 重 定 位 所 介绍 的 体系 结构 增强 都 需要 在 处 理 融 里 添加 两 个 额外 的 寄存 
器 。 让 我 们 回顾 一 下 这 两 个 机 制 以 及 对 应 的 实现 。 对 比 图 7-3 和 图 7-4 里 需要 的 数据 通路 操 
作 ， 图 7-3 里 需要 进行 两 次 比较 操作 来 检查 界限 ， 图 7-4 里 需要 进行 一 次 加 法 操作 ， 然 后 进行 
一 次 比较 操作 。 因 此 ， 在 两 个 方案 里 都 需要 进行 两 次 算术 操作 来 从 CPU 地 址 得 到 内 存 地 址 。 
因此 ， 两 个 机 制 甚至 在 硬件 复杂 性 和 延迟 上 都 差不多 。 但 是 ， 采 用 基 址 和 限 长 寄存 器 带 来 的 
内 存 利用 率 的 好 处 是 巨大 的 。 这 就 是 一 点 点 人 类 的 才智 可 以 帮助 我 们 在 不 增加 投入 的 情况 下 
理 来 巨大 收益 的 例证 。 


7.3 ”内存 分 配方 案 


假设 有 硬件 支持 ， 并 且 内 存 管理 器 也 采用 了 基 址 + 限 长 寄存 器 的 方案 ， 现 在 来 讨论 内 存 
分 配 的 策略 。 在 每 种 情况 下 ， 我 们 都 给 出 进行 内 存 管理 所 需要 的 数据 结构 。 


7.3.1 固定 尺寸 分 区 


在 该 策略 中 ， 内 存 管理 器 把 内 存 划 分 为 固定 尺寸 的 分 区 。 让 我 们 来 理解 内 存 管 理 器 所 需 
的 数据 结构 。 图 7-5 展示 了 一 种 可 行 的 数据 结构 ， 即 一 个 保存 在 内 核 空间 里 的 分 配 表 。 效 果 
就 是 ， 内 存 管 理 器 通过 该 数据 结构 来 管理 用 于 用 户 程序 的 那 部 分 内 存 。 为 了 本 分 配 策略 ， 表 
中 包含 了 三 个 字段 ， 如 图 7-5 所 示 。 被 占 位 表示 该 分 区 是 否 已 经 被 使 用 。 如 果 该 分 区 已 经 被 
分 配 ， 则 该 位 为 1 ; 否则 的 话 ， 则 该 位 为 0。 当 一 个 进程 请 求 内 存 时 〈 既 可 能 是 在 加 载 时 也 可 
能 是 在 执行 过 程 中 )， 选 择 一 个 尺寸 大 于 等 于 当前 需求 量 的 固定 尺寸 分 区 给 它 。 比 如 说 ， 如 果 
内 存 管 理 器 的 分 区 尺寸 有 1KB、5KB 和 8KB， 某 进程 Pl 请 求 了 一 块 6KB 大 小 的 内 存 块 ， 那 
么 它 就 会 被 分 配 到 一 块 8KB 大 小 的 分 区 。 内 存 管理 器 也 就 会 将 表 中 对 应 的 位 设置 为 1， 并 且 
在 该 进程 返回 该 内 存 块 时 把 该 位 清 零 。 在 P1 请 求 6KB 内 存 之 后 ,分 配 表 如 图 7-5a tN. W 
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意 在 8KB 分 区 中 有 2KB 2 lal He Bete OS o 





分 配 表 内 存 
Bai | 分 区 大 小 | 





| | | 
| 
| oe | x] 
图 7-5 ”固定 尺寸 分 区 的 分 配 表 


不 幸 的 是 ， 即 使 男 一 个 进程 申请 2KB 内 存 ， 也 不 可 能 把 浪费 的 空间 分 配给 它 。 这 是 因为 
分 配 表 以 固定 尺寸 的 分 区 为 基础 维护 着 总 结 信息 。 这 个 现象 被 称 作 内 部 碎片 ， 指 的 就 是 固定 
尺寸 分 区 内 部 浪费 空间 ， 而 这 种 浪费 会 叶 致 内 存 利用 率 低 下 。 一 般 来 说 ,内 部 雄 片 是 内 存 分 
配 的 粒度 与 实际 请 求 内 存 尺 寸 的 差 。 


内 部 碎片 = 固定 分 区 大 小 一 实际 内 存 请 求 (7-1) 


分 配 表 内 存 


ast | 分 区 大 小 | 进程 
E 





图 7-5 a) 在 P1 的 请 求 被 满足 后 的 分 配 表 
一 个 内 存 管 理 器 以 4KB 的 固定 尺寸 块 为 单位 进行 内 存 分 配 。 可 能 的 最 大 内 部 碎片 是 多 大 ? 
aes 


进程 所 能 申请 的 最 小 内 存 大 小 为 1 字 节 ， 此 时 内 存 管 理 器 会 分 配 一 个 4KB 的 分 区 以 满足 此 要 求 。 
因此 ， 最 大 内 部 碎片 =4KB -1 

= 4096 — 1 

= 4095 #4 


假设 在 Pl 有 8KB 分 区 时 男 一 个 内 存 分 配 请 求 需要 6KB。 那 么 这 时 该 请 求 无 法 满足 ， 虽 
然 累计 来 说 (把 SKB 和 1KB 的 分 区 加 起 来 ) 还 是 有 6KB 的 内 存 空间 ， 却 无 法 满足 该 新 请 求 ， 
因为 这 两 个 分 区 不 是 连续 的 (而 且 进 程 的 请 求 所 要 求 的 是 连续 的 一 段 内 存 )。 这 个 现象 被 称 作 
外 部 碎片 ， 这 也 会 导致 内 存 利用 率 低下 。 一 般 来 说 ， 外 部 碎片 是 所 有 内 存 系统 可 用 的 不 连续 
内 存 块 的 总 和 。 


外 部 碎片 = 守 所 有 不 连续 的 内 存 分 区 (7-2 ) 


7.3.2 BKK 


为 了 克服 内 部 碎片 的 问题 ， 我 们 来 讨论 一 下 分 配 可 变 长 度 的 分 区 以 适应 内 存 请 求 的 需求 
的 内 存 管理 器 。 假 设 内 存 管理 器 总 共有 13KB 的 内 存 可 用 。 这 一 回 内 存 管理 器 并 不 像 上 一 个 
方案 那样 拥有 一 张 静 态 的 分 配 表 ， 而 是 在 运行 过 程 中 动态 地 建立 分 配 表 。 图 7-6 展示 了 在 进 
行 任何 分 配 之 前 分 配 表 的 初始 状态 。 
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分 配 表 内 存 
o | w | ree 


图 7-6 变 长 分 区 的 分 配 表 


图 7-6a 则 展示 了 内 存 管理 器 处 理 一 系列 申请 内 存 的 请 求 之 后 的 分 配 表 。 注 意 管理 器 在 满 
足 P1、P2、P3 的 请 求 之 后 还 剩 下 2KB 的 剩余 空间 。 





图 7-6 a) 处 理 了 来 自 P1(2KB), P2(6KB) 和 P3(3KB) 的 请 求 之 后 的 变 长 分 区 的 分 配 表 
图 7-6b 则 展示 了 在 Pi SEMA, W P1 占据 的 2KB 分 区 也 被 标记 成 了 未 被 使 用 。 





图 7-6 b) 在 Pl 完 成 之 后 的 变 长 分 区 的 分 配 表 


假设 新 进程 P4 新 申请 了 4KB 内 存 。 不 幸 的 是 ， 该 请 求 不 能 被 满足 ， 因 为 P4 申请 的 空间 
需要 是 连续 的 ， 但 是 可 用 的 空间 却 是 碎片 状 的 ， 如 图 7-6b 所 示 。 因 此 ， 变 长 分 区 虽然 解决 了 
内 部 碎片 的 问题 ， 却 不 能 解决 外 部 碎片 的 问题 。 

随 着 进程 的 结束 ， 内 存 中 也 会 产生 可 用 空间 组 成 的 洞 。 分 配 表 记 录 着 这 些 可 用 空间 。 
如 果 分 配 表 中 的 相 邻 项 都 是 可 用 的 ， 那么 管理 器 将 会 把 它们 合并 成 为 一 大 块 ， 如 图 7-6c 
和 图 7-6d 所 示 。 





288 图 7-6 c) 在 P2 释放 内 存 前 的 变 长 分 区 的 分 配 表 
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一 











图 7-6 d) 在 P2 释放 内 存 后 的 变 长 分 区 的 分 配 表 


图 7-6b 和 图 7-6d 中 所 示 情 况 下 最 大 的 外 部 碎片 分 别 是 多 少 ? 
A 


在 图 7-6b 中 ， 有 两 个 2KB 的 分 块 不 连续 。 因 此 
外 部 碎片 =4KB 

在 图 7-6d 中 ， 有 两 个 分 别 为 2KB 和 8KB 的 分 块 不 连续 ， 因 此 
外 部 碎片 = 10 KB 


在 接 到 一 个 新 的 内 存 请 求 时 ， 内 存 管 理 器 进行 内 存 分 配 有 多 种 选择 。 这 里 列 出 两 种 可 

1 ) 最 佳 适 应 ”管理 器 检查 一 遍 分 配 表 ， 找 出 大 小 最 适合 新 请 求 的 分 块 。 比 如 说 ， 参 
见 图 7-6d， 如 果 请 求 的 大 小 为 1KB WAAC ae Sita Al 2KB 的 分 区 来 满足 请 求 ， 而 
不 是 使 用 8KB 的 那 块 空间 。 

2 ) 首次 适应 ”管理 器 找 出 第 一 个 适合 新 请 求 的 分 块 。 比 如 说 ， 参 见 图 7-6d， 分 配器 会 分 
S 8KB 的 分 区 来 满足 1KB 的 请 求 。 


分 配 算 法 的 选择 需要 进行 权衡 。 最 佳 适 应 算法 在 分 配 表 很 大 时 的 时 间 复 杂 o {H 
是 最 佳 适应 算法 的 内 存 利 用 率 会 较 高 ， 因 为 外 部 碎片 较 少 。 
7.3.3 4aFF 


内 存 管理 器 会 在 外 部 碎片 超出 可 容忍 极限 以 后 采用 一 种 叫做 缩 并 的 技术 。 例 如 ， 参 见 
图 7-6d， 内 存 管 理 器 可 能 会 把 P3 的 内 存 重 新 放 到 从 地 址 0 开始 的 位 置 ， 从 而 创建 出 一 段 
连续 的 10KB 空间 ， 如 图 7-6e 所 示 。 缩 并 是 个 代价 高 昂 的 操作 ， 因 为 P3 的 内 存 范围 里 的 所 
有 奶 入 地 址 都 得 进行 调整 ， 才 能 保持 语义 不 变 。 不 仅 昂 贵 ， 而 且 实际 上 在 大 部 分 体系 结构 里 
根本 就 是 不 可 能 。 回 忆 一 下 20 世纪 60 年 代 的 早期 内 存 管理 方案 。 就 是 为 了 引入 动态 重 定位 ， 
IBM 360 才 引 入 了 基 址 寄存 器 9S ORR 7-4 里 的 方案 差 不 了 多 少 )。OS/360 操作 系统 会 在 加 载 
程序 的 时 候 进 行动 态 重 定位 。 但 是 ， 即 使 用 了 这 个 方案 ， 当 一 个 进程 被 加 载 到 内 存 中 以 后 
缩 并 内 存 还 是 需要 做 不 少 事情 ， 比 如 说 把 进程 暂停 以 便 进 行 重 定 位 。 更 进一步 地 说 ， 缩 并 的 
代价 随 着 需要 重 定位 的 进程 个 数 上 升 而 上 分 配 表 _ Ate 
升 。 因 此 ， 就 算 在 体系 结构 里 进行 内 存 缩 -进程 | [6 
并 是 可 行 的 ， 内 存 管 理 硕 也 很 少 这 么 干 。 
缩 并 通常 是 跟 替 换 一 起 进行 的 一 一 也 就 是 
说 ， 内 存 管理 器 会 在 进程 从 硬盘 换 回 内 存 
的 时 候 顺 便 进行 重 定位 。 图 7-6 © 缩 并 内 存 以 创建 大 的 连续 空间 
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7.4 分 页 虚拟 内 存 


随 着 内 存 容量 持续 攀升 ， 外 部 碎片 就 变 成 了 很 严重 的 问题 。 我 们 需要 解决 它 。 

让 我 们 回顾 一 下 基础 知识 。 在 用 户 眼 中 ,程序 在 内 存 中 占据 着 连续 的 一 段 。 我 们 迄今 
止 讨论 的 对 内 存 管理 的 硬件 支持 至 多 就 是 把 程序 重 定 位 到 与 用 户 所 看 到 的 地 址 不 同 的 地 方 去 。 
我 们 需要 绕 开 这 个 用 户 视角 里 固有 的 关于 连续 内 存 的 假设 。 虚 拟 内 存 的 概念 就 有 助 于 绕 开 此 
假设 。 分 页 则 是 实现 这 一 概念 的 手段 。 

想法 就 是 让 用 户 保留 关于 程序 得 到 的 是 一 段 连 续 内 存 的 感觉 ， 因 为 这 样 让 程序 编写 起 来 
容易 一 些 。 内 存 代 理 (参见 图 7-1 ) 则 把 这 个 连续 的 概念 分 割 成 相等 大 小 的 逻辑 实体 ， 这 些 逻 
辑 实 体 被 称 作 页 。 类 似 地 ， 物 理 内 存 由 页 帧 组 成 ， 我 们 将 会 简单 地 称呼 为 物理 帧 。 逻 辑 页 和 
物理 帧 的 大 小 相同 且 固定 ， 称 作 页 大 小 。 物 理 帧 中 承载 着 一 个 逻辑 页 。 





图 7-7 关于 相框 的 类 比 


让 我 们 考虑 一 个 类 比 。 教 授 想 熟悉 整个 大 班 的 所 有 学 生 。 为 了 达成 目的 ,他 用 了 以 下 手 
Br: 他 把 班 上 学 生 的 照片 收集 下 来 。 他 在 办 公 室 有 个 空 相 框 ( 见 图 7-7a)。 当 一 个 学 生 在 他 的 
办 公 时 间 来 访 ， 他 就 把 该 学 生 的 照片 放 进 相框 〈 见 图 7-7b)。 当 下 一 个 学 生来 访 ， 他 就 再 在 相 
框 中 换 一 次 照片 ( 见 图 7-7c)。 教 授 并 没有 给 每 个 学 生 都 准备 一 个 相框 ， 只 是 为 不 同 的 学 生 重 
用 同一 个 相框 。 他 也 不 需要 给 每 个 学 生 准备 一 个 单独 的 相框 ， 因 为 他 在 办 公 时 间 见 到 学 生 总 
是 一 个 一 个 地 见 到 。 

把 物理 内 存 分 割 成 很 多 页 帧 的 过 程 与 这 个 简单 的 例子 有 很 多 相似 之 处 。 相 框 可 以 装载 任 
何 照片 。 类 似 地 ， 给 定 的 物理 帧 可 以 用 来 承载 任何 逻辑 页 。 内 存 代 理 维护 着 用 户 的 远 辑 页 和 
物理 内 存 的 物理 帧 之 间 的 映射 关系 。 不 难 猜 到 ， 给 每 个 程序 创建 这 样 的 映射 关系 是 内 存 管理 
需 的 职责 。 一 个 被 称 作 页 表 的 实体 用 来 存放 从 逻辑 页 到 物理 帧 的 映射 和 关系。 页 表 的 效果 就 是 
把 用 户 所 看 到 的 内 存 和 物理 上 的 内 存 组 织 区 分 
开 来 。 因 此 ， 我 们 把 用 户 看 到 的 内 存 称 作 虚 拟 
内 存 ， 而 把 逻辑 页 面 称 作 虚 拟 页 。CPU 产生 对 
应 着 用 户 视角 的 虚拟 地 址 。 代 理 把 虚拟 地 址 通 
过 查 表 (参见 图 7-8 ) 转换 到 物理 地 址 。 了 既然 我 
们 已 经 区 分 清楚 了 用 户 视角 和 物理 组 织 ， 虚 拟 
内 存 和 物理 内 存 的 相对 大 小 就 无 所 谓 了 。 例 如 ， 
从 用 户 的 角度 看 到 的 虚拟 内 存 比 实际 的 物理 内 ”图 7.8 页 表 。 内 存 代理 可 以 把 用 户 程序 产生 的 
存 大 得 多 是 完全 合理 的 。 实 际 上 ， 这 就 是 现在 虚拟 地 址 按 页 查 表 得 到 物理 地 址 
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大 部 分 内 存 系统 的 常态 。 较 大 的 虚拟 内 存 消除 了 由 于 物理 内 存 受 限 而 引起 的 资源 限制 ， 给 用 
户 程序 以 内 存 很 大 的 幻象 。 

内 存 代 理 只 需要 在 同一 页 中 维持 用 户 关 于 连续 内 存 的 假设 即 可 。 不 同 页 面 则 不 必 在 物理 
内 存 中 处 于 连续 的 位 置 。 图 7-9 展示 了 一 个 程序 ， 它 已 经 通过 分 页 技术 把 四 个 虚拟 页 面 映射 
到 了 四 个 物理 帧 上 。 注 意 分 页 技术 解决 了 外 部 碎片 的 问题 。 但 是 内 部 碎片 还 是 可 能 存在 。 由 
于 帧 大 小 是 固定 的 ， 如 果 请 求 的 内 存 大 小 只 能 填充 帧 的 一 部 分 ， 还 是 会 产生 内 部 碎片 。 





图 7-9 打破 用 户 的 连续 虚拟 内 存 的 视角 


7.4.1 页 表 


让 我 们 深入 看 看 分 页 的 概念 。 既 然 虚拟 页 (或 者 物理 帧 ) 的 大 小 固定 ， 而 同一 页 中 的 地 
址 是 连续 的 ， 我 们 可 以 把 CPU 生成 的 虚拟 地 址 看 成 由 两 部 分 组 成 : 虚拟 页 号 ( VPN，Virutal 
Page Number) 和 页 中 的 偏 移 量 。 为 了 解释 方便 ， 我 们 假定 页 面 大 小 是 2 WERKE. FE 
先 把 虚拟 地 址 分 成 两 部 分 。 这 件 事情 简便 易 行 。 记 住 页 中 所 有 的 地 址 都 是 连续 的 。 所 以 ， 虚 
拟 地 址 的 偏 移 量 肯 定 就 来 自 它 的 低位 。 偏 移 量 所 需 的 位 的 个 数 直 接 由 页 大 小 就 可 以 知道 。 比 
如 说 ， 如 果 页 大 小 为 8KB， 则 页 中 有 2 ”个 不 同 的 字 节 ， 因 此 我 们 需要 13 个 位 来 给 每 个 字 市 
进行 寻 址 ， 这 也 就 是 偏 移 量 的 长 度 。 虚 拟 地 址 的 剩 下 高 位 就 组 成 了 虚拟 页 号 。 一 般 来 说 ， 如 
果 页 大 小 为 N， 则 虚拟 地 址 的 logsN 个 低位 组 成 页 偏 移 量 。 


考虑 一 个 有 32 位 虚拟 地 址 的 内 存 系统 。 假 设 页 大 小 为 8KB。 画 出 虚拟 地 址 分 成 虚拟 页 号 和 页 
偏 移 量 的 布局 。 
答 : 
每 个 页 有 8KB。 我 们 需要 13 个 位 才能 对 页 中 每 个 字 节 进行 寻 址 。 由 于 页 中 的 字 节 是 连续 的 ， 这 
13 个 位 也 就 是 虚拟 地 址 的 最 低位 ( 即 第 0 ~ 12 位 )。 
虚拟 地 址 的 剩 下 19 个 高 位 ( 即 第 13 ~ 31 位 ) 则 组 成 虚拟 页 号 。 
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进行 上 下 文 切换 时 ， 寄 存 器 值 会 从 新 分 发 的 进程 的 PCB 中 加 载 。 
考虑 一 个 有 32 位 虚拟 地 址 和 24 位 物理 内 存 的 内 存 系统 。 假 设 
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31 13 12 0 


把 虚拟 地 址 转换 为 物理 地 址 就 是 查 页 表 来 得 到 对 应 于 虚拟 页 号 的 物理 帧 号 (Physical 
Frame Number，PFN)。 图 7-10 展示 了 这 个 转换 过 程 。 图 7-10 的 阴影 部 分 是 内 存 代理 所 做 工 
作 的 硬件 部 分 。 人 硬件 查找 页 表 以 把 虚拟 地 址 转换 为 物理 地 址 。 那 么 ， 页 表 应 该 放 在 内 存 的 什 
么 地 方 呢 ? 既然 硬件 必须 得 在 每 次 内 存 访问 的 时 候 碍 找 页 表 来 进行 地 扯 转 换 ， 似 乎 把 它 放 在 
CPU 数据 通路 里 是 个 好 想法 。 让 我 们 来 检查 一 下 这 个 想法 的 可 行 性 。 我 们 对 于 每 个 虚拟 页 号 
都 需要 一 个 表 中 的 项 目 。 在 例 7-3 里 ， 我 们 需要 2 ”个 页 表 项 目 。 因 此 ， 把 页 表 实 现 为 处 理 器 
数据 通路 的 一 部 分 是 不 可 取 的 。 而 且 这 样 的 话 ， 系 统 里 就 只 能 有 一 个 页 表 。 而 为 了 内 存 保护 ， 
每 个 进程 都 需要 自己 的 页 表 。 


虚拟 
地 址 





内 存 
me 
物理 
页 表 


图 7-10 地址 转换 。 页 表 用 的 是 虚拟 地 址 的 虚拟 页 号 的 部 分 作为 查找 索引 ， 用 来 查找 物 
理 帧 号 。 虚 拟 地 址 的 页 偏 移 量 被 附加 在 物理 帧 号 之 后 ， 以 得 到 物理 地 址 


因此 ， 每 个 进程 都 有 一 个 页 表 驻 留 在 内 存 里 ， 如 图 7-11 Rte 人 
IRo CPU 需要 知道 内 存 中 的 页 表 的 位 置 ， 以 便 可 以 进行 地 址 转换 。 
出 于 这 个 目的 ， 我 们 向 CPU 的 数据 通路 里 添加 一 个 新 的 寄存 右 ， 
页 表 基 址 寄存 器 ( PTBR，Page Table Base Register)， 其 中 包含 当 
前 运行 进程 的 页 表 的 基地 址 。PTBR 是 进程 控制 块 的 一 部 分 。 在 


页 大 小 是 4KB。(a) 展示 虚拟 和 物理 地 址 的 布局 。(b) 页 表 会 有 多 大 ? 该 
内 存 系统 中 包含 多 少 个 页 帧 ? 
ae, 


AH.: 


a. 既然 页 大 小 为 4KB， 那 么 32 位 虚拟 地 址 的 低 12 位 就 是 页 偏 移 ”图 7-11 物理 内 存 中 的 页 表 
量 ， 而 剩 下 的 高 位 (20 位 ) 则 是 虚拟 页 号 。 





31 12 11 0 


由 于 物理 地 址 是 24 位 ， 它 的 高 12 ( 即 24-12 ) 位 就 组 成 了 物理 帧 号 。 
物理 地 址 的 布局 : 
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23 12 11 0 


b. 页 表 项 数 三 2 PMR SHH _ 420 
假设 每 个 项 是 一 个 字 ， 即 32 位 (4 字 节 )。 
页 表 的 大 小 =4 x 90 = -4MB 
页 帧 的 个 数 = 2 物理 帧 号 的 位 数 _ 412 _ 4096 


7.4.2 支持 分 页 的 硬件 


文 持 分 页 需要 用 什么 硬件 一 目 了 然 。 我 们 需要 向 数据 通路 添加 一 个 新 的 寄存 器 ， 即 页 表 
基 址 寄存 右 。 在 每 次 内 存 访 问 的 时 候 ， 处 理 器 根据 页 表 基 址 寄存 器 里 的 值 ， 算 出 对 应 于 虚拟 
地 址 的 页 表 项 的 地 址 。 从 这 个 页 表 项 中 读 取 到 的 是 物理 帧 号 ， 把 它 与 页 偏 移 量 连接 在 一 起 以 
后 就 得 到 了 物理 地 址 。 这 就 是 在 流水 线 处 理 需 的 FETCH 和 MEM 阶段 中 分 别 读 取 指 令 和 数 
据 时 都 要 用 到 的 转换 过 程 。 添 加 到 处 理 器 以 支持 分 页 的 新 增 硬 件 出 人 意料 得 少 ， 尤 其 是 与 它 
为 内 存 管理 带 来 的 巨大 好 处 相 比 而 言 。 让 我 们 回顾 一 下 采用 分 页 给 内 存 访问 带 来 的 额外 开销 。 
本 质 上 说 ， 硬 件 每 次 访 存 得 访问 两 次 内 存 : 第 一 次 是 去 读 取 物理 帧 号 ， 而 第 二 次 则 是 去 读 取 
内 存 内 容 (指令 或 者 是 数据 )。 这 似乎 相当 低 效 ， 从 维持 高 性 能 处 理 器 流水 线 的 角度 来 说 是 完 
全 不 可 采取 的 。 幸 运 的 是 ， 可 以 大 幅度 地 减少 这 种 低 效 ， 从 而 让 分 页 实际 上 可 行 。 这 里 的 关 
键 在 于 记 住 最 近 地 址 转换 的 结果 ， 因 为 我 们 很 可 能 会 去 访问 同一 个 物理 页 的 很 多 内 存 位 置 。 
Ab FH AS A Sc HE th — 1 RR VE HE #4 A (TLB, Translation Lookaside Buffer) 的 表 。 只 有 
在 没有 找到 映射 关系 的 时 候 ， 处 理 器 才 会 从 物理 地 址 里 面 去 读 取 物 理 帧 号 。 想 知道 更 多 关于 
TLB 的 信息 ， 请 参阅 下 一 章 ( 见 8.6 节 )。 


7.4.3 页 表 的 建立 


内 存 管理 锅 在 进程 司 动 的 时 候 设 置 页 表 。 从 这 个 意义 上 来 说 ， 页 表 有 着 双重 职责 。 硬 件 
用 它 来 进行 地 址 转换 。 而 它 也 是 内 存 管理 带 控 制 之 下 的 一 个 数据 结构 。 通 过 设置 页 表 ， 内 存 
管理 器 把 进程 的 页 表 基 址 寄存 如 的 值 存在 进程 控制 块 中 。 图 7-12 就 展示 了 加 上 页 表 基 址 寄存 
名 之 后 的 进程 控制 块 。 


typedef struct control block type { 
enum state type state; 
address PC; 
int reg file[NUMREGS]; 


struct control block *next_pcb; 


int priority; 


address PTBR; 


} control block; 





图 7-12 ”加 上 了 页 表 基 址 寄存 器 字段 的 进程 控制 块 。 只 需要 加 上 这 一 个 字段 ， 就 足以 让 
操作 系统 确定 进程 的 内 存 印迹 
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7.4.4 ”虚拟 和 物理 内 存 的 相对 大 小 


根据 迄今 为 止 的 讨论 ， 看 起 来 虚拟 内 存 的 意义 就 在 于 把 程序 员 从 可 用 物理 内 存 的 限制 中 
解放 出 来 。 自 然 ， 这 让 我 们 觉得 虚拟 内 存 应 该 总 是 比 物理 内 存 大 。 这 么 考虑 当然 是 完全 符合 
逻辑 的 。 尽 管 这 么 说 ， 让 我 们 也 来 看 看 ， 让 物理 内 存 比 虚拟 内 存 大 有 没有 意义 。 我 们 立刻 可 
以 看 出 ， 这 样 做 对 于 单个 程序 来 说 没有 好 人 处， 因为 程序 可 以 用 到 的 地 址 空间 是 受 限 于 虚拟 内 
存 的 大 小 的 。 比 如 说 ， 如 果 虚 拟 地 址 空间 是 32 位 的 ， 给 定 的 程序 就 只 能 访问 4GB 的 内 存 。 
即使 系统 的 物理 内 存 超 过 4GB ， 单 个 程序 也 无 法 拥有 超过 4GB 的 内 存 印迹 。 但 是 ， 更 大 的 物 
理 内 存 方便 让 操作 系统 可 以 装 下 更 多 的 消耗 内 存 的 进程 。 这 也 是 Intel 体系 结构 的 物理 地 址 扩 
展 ( PAE，Physical Address Extension) 把 物理 地 址 从 32 位 扩展 到 36 位 的 意义 所 在 。 结 果 就 
是 这 个 特性 让 系统 可 以 拥有 至 多 64GB 的 物理 内 存 ， 而 操作 系统 可 以 (通过 页 表 ) 给 特定 进程 
映射 4GB 虚拟 地 址 空间 ， 以 居留 在 64GB 物理 内 存 中 的 不 同 部 分 。9 

有 人 也 许 会 这 么 推断 ; 随 着 支持 多 于 32 位 物理 地 址 的 技术 的 到 来 ， 处 理 器 体系 结构 也 应 
该 支持 更 大 的 虚拟 地 址 空间 了 了。 他 们 猿 对 了 。 实 际 上 ， 包 括 Intel 在 内 的 商家 已 经 设计 出 了 64 
位 的 体系 结构 。Intel 提供 物理 地 址 扩展 特性 的 原因 只 是 允许 仍 在 应 用 中 的 运行 着 遗留 应 用 程 
序 的 32 位 平台 使 用 到 更 多 的 内 存 。 


7.5 分 段 虚拟 内 存 


让 我 们 来 考虑 一 个 类 比 。 图 7-13 展示 了 一 个 屋子 的 规划 图 。 它 有 一 个 客厅 、 一 个 起 居 
室 、 一 个 和 餐厅， 可 能 还 有 一 个 书房 和 一 个 或 多 个 目 室 。 换 句 话 说， 我 们 先 从 人 逻辑 上 把 房屋 的 
空间 划分 成 者 干 功能 单元 。 然 后 ， 我 们 可 以 根据 房屋 的 总 可 用 空间 来 把 实际 的 物理 空间 分 配 
给 各 个 房间 。 因 此 ,我们 可 能 会 决定 让 客人 的 卧室 比比 方 说 小 孩 的 卧室 略 大 一 些 。 我 们 也 许 
会 有 一 个 与 正式 的 餐厅 相 比 更 加 温 获 的 早餐 区 域 ， 等 等 。 这 种 对 空间 的 功能 性 组 织 有 多 个 好 
处 。 如 果 你 有 访客 ， 你 不 必 重 整 家 里 的 任何 东西 ， 只 需要 让 他 们 住 进 访客 卧室 即 可 。 如 果 你 
决定 带 朋 友 来 家 里 过 夜 ， 只 需 与 该 朋友 共享 你 的 卧室 即 可 ， 而 不 用 打扰 到 家 里 的 其 他 成 员 。 
让 我 们 把 这 个 类 比 应 用 到 程序 开发 上 去 。 

在 前 一 章 中 (参见 6.2 节 )， 我 们 把 进程 的 地 址 空间 定义 为 程序 的 内 存 印迹 占用 的 空间 。 
在 前 一 节 中 ， 我 们 强调 了 维持 用 户 程 序 的 内 存 印迹 是 连续 的 这 个 景象 是 必需 的 。 我 们 现在 更 
进一步 ， 强 调 让 地 址 空间 从 0 开始 到 某 个 最 大 值 的 重要 性 ， 因 为 它 对 编译 需 生 成 代码 来 说 很 
便利 。 虚 拟 内 存 可 帮助 实现 这 个 景象。 

让 我 们 研究 一 下 地 址 空间 对 程序 来 说 是 否 足 够 。 与 房屋 空间 安排 的 类 比 在 这 里 很 有 用 。 
我 们 把 房屋 从 逻辑 上 根据 用 途 划 分 成 不 同 的 房间 。 这 些 空间 彼此 独立 且 受 到 保护 ( 门 和 锁 
等 )。 这 确保 了 没有 人 可 以 在 不 事先 告知 的 情况 下 浆 进 对 方 的 私人 空间 。 在 某 个 层面 上 ， 构 建 
程序 类 似 于 设计 房屋 。 尽 管 我 们 最 后 得 到 的 是 单一 的 程序 (在 UNIX 术语 中 称 作 aout), DE 
码 是 有 逻辑 结构 的 。 不 同 的 数据 结构 和 过 程 组 织 起 来 以 负责 提供 特定 功能 。 如 果 这 是 一 个 团 
队 项 目 ， 你 甚至 会 属于 一 个 开发 团队 ， 其 中 每 个 人 都 负责 整个 程序 的 不 同 功 能 。 你 可 以 想象 
一 下 ,开发 诸如 微软 Word 一 类 的 复杂 软件 时 参与 的 软件 工程 师 数目 。 因 此 ， 有 多 个 地 址 空间 
可 用 会 有 助 于 把 程序 从 逻辑 上 组 织 得 更 好 。 尤 其 是 有 了 面向 对 象 编程 之 后 ， 有 多 个 地 址 空间 


O 如 果 想 了 解 更 多 信息 ， 建 议 感 兴趣 的 读者 参阅 Intel® 64 and IA-32 Architectures Software Developer's 
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的 好 处 怎么 强调 都 不 为 过 ，。 





图 7-13 ”房屋 的 布局 设计 9。Edenlane Homes, Inc. 公司 版 权 所 有 并 保留 所 有 权利 。 本 书 
经 过 许可 使 用 该 图 


让 我 们 再 深入 一 点 ， 理 解 有 多 个 地 址 空间 会 如 何 帮助 开发 者 。 即 使 只 是 考虑 基本 的 内 存 
印迹 (参见 第 6 章 的 图 6-1 )， 我 们 可 以 让 内 存 印迹 的 不 同 部 分 一 一 即 ， 代 码 、 全 局 数据 、 堆 
和 栈 一 一 被 放 在 不 同 的 地 址 空间 里 。 从 软件 工程 的 角度 来 看 ， 这 种 安排 让 我 们 可 以 给 不 同 地 
址 空间 以 不 同属 性 (比如 说 ， 代 码 段 是 只 读 的 ， 等 等 )。 此 外 ， 能 够 给 不 同 的 地 址 空间 分 配属 
性 的 能 力 对 于 调试 程序 来 说 极其 有 用 。 

在 大 型 程序 的 开发 中 使 用 多 个 地 址 空间 的 需要 就 更 加 迫切 。 比 方 说 ， 我 们 要 写 一 个 视频 
监控 系统 。 它 可 能 有 多 个 组 件 ， 如 图 7-14 所 示 。 你 能 看 出 有 多 个 组 件 ， 并 且 每 个 组 件 拥有 各 7 
自 的 地 址 空间 的 程序 与 图 7-13 中 的 房间 布局 方案 之 间 的 相似 之 处 。 298 
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图 7-14 ”一 个 样 例 应 用 程序 : 视频 监控 系统 。 这 类 复杂 的 应 用 程序 会 由 奋 干 模块 组 成 ， 
并 且 很 可 能 是 由 一 支 软件 工程 师 团 队 负 责 开 发 
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这 是 个 足够 复杂 的 工作 ， 以 至 于 得 要 很 多 人 一 起 为 项 目 工 作 。 团 队 成 员 在 使 用 具有 良 定 
义 的 接口 的 情况 下 ， 可 以 彼此 独立 地 开发 图 7-14 所 示 的 各 个 方 框 。 让 这 些 组 件 分 别 在 不 同 的 
地 址 空间 运行 ， 并 且 配 上 合适 的 保护 和 共享 级 别 (类 似 于 在 房屋 设计 中 的 门 和 锁 )， 会 对 开发 
和 调试 给 予 极 大 的 帮助 。 更 进一步 地 说 ， 这 也 使 得 维护 这 样 的 应 用 程序 变 得 容易 。 如 有 果 你 只 
是 要 给 厨房 铺 地 砖 ， 就 不 必 临 时 搬 进 酒店 住 一 阵子 。 类 似 地 ， 你 可 以 重 写 该 应 用 程序 的 特定 
功能 模块 ， 而 不 影响 其 他 部 分 。 

分 段 就 是 实现 前 述 景 象 的 技术 。 与 所 有 系统 级 机 制 一 样 ， 本 技术 也 是 操作 系统 与 体系 结 
构 的 合作 的 成 果 。 

内 存在 用 户 眼 中 的 景象 并 不 是 单一 的 线性 地 址 空间 ， 而 是 由 多 个 不 同 的 地 址 空间 组 成 。 
每 个 这 样 的 地 址 空间 都 被 称 作 一 个 段 。 段 有 两 个 属性 : 


。 唯一 的 段 编号 
每 个 段 都 从 地 址 0 开始， 直到 ( 段 大 小 -1 ) 未 
知 。CPU 产生 的 地 址 由 两 部 分 组 成 ， 如 图 7-15 所 示 。 图 7-15 分 段 的 地 址 


和 分 页 一 样 ， 内 存 代 理 在 CPU 和 内 存 之 间 ， 通 过 查找 分 段 表 来 把 地 址 转换 为 物理 地 址 
( 见 图 7-16 )。 与 分 页 一 也 是 操作 系统 负责 给 当前 运行 的 进程 设置 段 表 。 

现在 你 很 可 能 会 想 ， 除 了 名 字 从 页 变 成 段 
以 外 ， re me dee 区 别 。 
在 深入 讨论 两 者 的 差异 以 前 ， 让 我 们 回 到 图 
7-14 中 的 样 例 应 用 程序 。 采 用 分 段 ， 我 们 可 以 
将 这 个 应 用 程序 安排 成 图 7-17 那样 。 注 意 每 个 
功能 模块 都 在 自己 的 段 中 ， 而 各 个 段 分 别 有 一 
个 大 小 ， 取 决 于 对 应 组 件 的 功能 。 图 7-18 展示 
了 这 些 段 在 物理 内 存 中 的 布局 。 





图 7-17 样 例 程序 被 组 织 成 多 个 有 段 
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图 7-18 图 7-17 中 应 用 程序 的 各 个 段 映 射 到 物理 内 存 中 


某 程 序 有 10KB 的 代码 空间 和 3KB 的 全 局 数据 空间 。 它 需要 5KB 的 堆 空 间 和 3KB 的 栈 空间 。 
编译 器 给 程序 的 前 述 组 件 分 别 分 配 了 一 个 段 。 物 理 内 存 的 分 配 如 下 所 示 : 


代码 起 始 地 址 1000 
全 局 数据 起 始 地 址 14000 
堆 空 间 起 始 地 址 20000 
栈 空间 起 始 地 址 30000 


a. E 出 该 程序 的 段 表 。 


nl 
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b. 假设 内 存 按 字 节 寻 址 ， 画 出 内 存 布局 。 
答 : 
c. 给 出 与 以 下 虚拟 地 址 对 应 的 物理 地 址 : 
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第 0 段 
(代码 ) 
第 1 段 
(全 局 数据 ) | 


第 2 Ex 
(HE) 


t 
t 






B: 
1. 偏 移 量 299 是 在 第 0 段 的 大 小 范围 内 (10KB). 
2. 物理 内 存 地 址 

= 第 0 段 起 始 地 址 + 偏 移 量 

= 1000 + 299 

= 1299 


7.5.1 支持 分 段 的 硬件 


支持 分 段 所 需 的 硬件 很 简单 。 段 表 是 个 类 似 于 页 表 的 东西 。 段 表 里 的 每 一 项 被 称 作 段 描 
述 符 。 段 描述 符 给 出 了 有 段 的 起 始 地 址 和 大 小 。 每 个 进程 都 有 自己 的 段 表 ， 由 操作 系统 在 创建 
的 时 候 负 责 分 配 。 类 似 于 分 页 的 是 ， 这 个 机 制 也 需要 在 CPU 中 的 一 个 专门 的 寄存 屡 ， 称 作 段 
表 基 址 寄存 器 (Segment Table Base Register，STBR )。 该 硬件 采用 该 寄存 器 以 及 段 表 来 在 进程 
执行 的 时 候 进 行 地 址 转换 (参见 图 7-19 )。 人 硬件 首先 会 进行 边界 检查 ， 以 确保 提供 的 仿 移 量 在 
该 段 的 限制 范围 内 ， 然 后 再 继续 处 理 内 存 访问 。 

读者 应 当 会 回忆 起 7.3.2 节 中 讲 到 的 变 长 分 区 的 内 存 分 配方 案 。 分 段 也 会 遇 到 和 变 长 分 区 
同样 的 问题 ， 也 就 是 外 部 碎片 。 这 可 从 图 7-18 中 看 出 。 


7.6 分 页 和 分 段 的 比较 


现在 我 们 已 经 准备 好 来 理解 分 段 和 分 页 的 区 别 了 。 两 个 都 是 实现 虚拟 内 存 的 技术 ， 但 是 
在 细节 上 差别 很 大 。 我 们 在 表 7-1 中 总 结 这 两 个 方法 的 异同 。 

乍 一 看 ， 你 会 觉得 分 段 有 很 多 好 处 。 因 此 很 容易 得 出 结论 ， 认 为 体系 结构 应 该 选用 分 段 
来 作为 实现 虚拟 内 存 的 载体 。 不 幸 的 是 ， 表 格 的 最 后 一 行 ， 即 外 部 碎片 ， 才 是 真正 重要 的 一 
点 。 也 还 有 其 他 的 考虑 ， 比 如 说 ， 采 用 分 页 时 CPU 生成 的 虚拟 内 存 地 址 占用 一 个 内 存 字 ,但 
是 采用 分 段 的 话 也 许 必须 得 用 两 个 内 存 字 才 能 指定 一 个 虚拟 地 址 。 这 是 因为 我 们 可 能 想 要 让 
每 个 段 都 能 与 总 可 用 地 址 空间 一 样 大 ， 以 求 尽量 大 的 灵活 性 。 这 意味 着 我 们 需要 一 个 内 存 字 
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来 表明 段 编 号 ， 另 一 个 内 存 字 来 表明 该 段 内 的 偏 移 量 。 另 一 个 重要 的 系统 级 的 考虑 是 平衡 整 
个 系统 。 让 我 们 详细 讨论 这 句 话 意味 着 什么 。 实 际 上 ， 应 用 程序 和 系统 软件 对 内 存 的 渴求 一 
下 持续 增长 。 桌 面 出 版 应 用 程序 和 浏览 器 的 每 个 版 本 的 内 存 印迹 的 增长 是 这 种 胃口 增长 的 例 
证 。 原 因 当 然 是 给 最 终 用 户 提供 更 多 功能 的 渴望 。 现 实 是 我 们 永远 没 法 提供 足够 的 物理 内 存 
满足 我 们 的 胃口 。 因 此 ， 虚 拟 内 存 必 须 得 远大 于 物理 内 存 。 页 和 段 得 能 够 “ 按 需 ” 地 从 硬盘 
上 被 加 载 进 物理 内 存 中 。 虚 拟 内 存 把 内 存 系统 从 物理 内 存 扩展 到 磁盘 中 。 因 此 ， 从 磁盘 向 内 
存 按 需 传 输 数 据 必须 得 高 效 ， 才 能 使 整个 系统 高 效 运转 。 这 就 是 我 们 所 说 的 对 系统 整体 进行 
平衡 。 由 于 页 大 小 是 个 系统 属性 ， 采 用 分 页 的 话 对 系统 整体 进行 平衡 会 较为 容易 。 由 于 用 户 
对 段 的 大 小 可 以 进行 控制 ， 在 使 用 分 段 的 情况 下 对 系统 整体 进行 优化 就 困难 一 些 。 


始 地 直 = 


段 编号 偏 移 量 
虚拟 地 址 


bi oem o 





Pa Da a 

非法 地 址 异常 Ja 

图 7-19 采用 分 段 机 制 的 地 址 转换 。 虚 拟 地 址 中 的 段 编 号 用 作 段 表 中 的 下 标 来 获得 段 的 
起 始 地 址 。 虚 拟 地 址 中 的 偏 移 量 则 加 到 起 始 地 址 之 上 ， 以 生成 实际 的 物理 地 址 
发 送 给 内 存 


表 7-1 分 页 和 分 段 的 对 比 


属性 rB 
受到 物理 内 存 大 小 的 限制 
与 物理 内 存 的 关系 物理 内 存 可 能 比 虚 拟 内 存 多 或 者 少 
每 个 进程 的 地 址 空间 多 个 
对 用 户 的 可 见 性 用 户 不 知道 分 页 的 存在 ， 用户 有 使 | ”用 户 知道 有 多 个 地 址 空间 ， 都 从 0 开始 
用 单一 线性 地 址 空间 的 假象 
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( 续 ) 
属性 A Ay Bt 
软件 工程 没有 明显 的 好 处 允许 程序 组 件 根据 用 户 需求 组 织 成 多 个 自 ; 
使 得 模块 化 设计 成 为 可 能 
增加 可 维护 性 
程序 调试 没有 明显 的 好 处 受到 模块 化 设计 的 帮助 
共享 和 保护 用 户 没有 直接 的 控制 权 用 户 可 以 直接 控制 各 个 段 的 共享 和 保护 


操作 系统 可 以 在 地 址 空间 之 间 实 现 | 对 面向 对 象 编程 和 大 型 软件 开发 特别 有 用 
共享 和 保护 ,但 是 从 用 户 的 角度 来 看 









没有 意义 
页 和 段 的 大 小 可 变 ， 用户 可 以 为 每 个 段 分 别 选择 
内 部 碎片 可 能 有 内 部 碎片 。 因 为 地 址 空间 里 | 无 
某 个 页 的 一 部 分 可 能 用 不 到 
外 部 碎片 无 可 能 有 外 部 碎片 。 因 为 变 长 的 段 必 须 在 可 
用 的 物理 内 存 中 分 配 ， 从 而 产生 空洞 (参见 


图 7-18 ) 


由 于 这 些 原因 ， 本 节 描 述 的 真正 的 分 段 不 是 实现 虚拟 内 存 的 可 行 方案 。 一 种 解决 外 部 碎 
片 的 方案 是 我 们 在 7.3.3 节 中 描述 的 那样 ， 即 使 用 内 存 缩 并 。 但 是 ， 我 们 也 观察 过 了 实践 中 实 
现 内 存 缩 并 的 难点 。 一 个 更 好 的 方法 是 采用 一 个 组 合 技术 ， 即 页 式 分 段 。 用 户 得 到 的 是 一 个 
分 段 的 景象 ， 如 本 节 描 述 。 而 在 内 部 ,操作 系统 和 人 硬件 采用 分 页 ， 如 上 市 所 描述 的 ， 以 消除 
外 部 碎片 的 不 民 影 啊 。 

关于 这 样 的 页 式 分 段 技术 的 深入 讨论 超出 了 本 书 范围 。 我 们 会 在 之 后 的 章节 里 从 历史 的 
视角 讲述 分 页 和 分 段 ， 还 有 一 个 商用 的 页 式 分 段 的 例子 ， 拿 mtel Pentium 体系 结构 作为 案例 
人 研究。 


7.6.1 解读 CPU 生成 的 地 址 


处 理 器 生成 简单 的 线性 地 址 来 在 内 存 中 寻 址 。 
CPU 生成 的 地 址 : 





ncPu 


CPU 生成 地 址 中 的 位 数 取决 于 处 理 器 的 寻 址 能 力 (通常 与 处 理 需 字 长 以 及 对 内 存 操作 数 
的 访问 的 最 小 粒度 相关 联 )。 比 如 说 ， 对 于 按 字 节 寻 址 的 64 位 处 理 咒 来 说 ，ncru = 64。 
物理 地 址 的 位 数 取决 于 物理 内 存 的 实际 大 小 。 


站 物理 
如 果 采 用 的 是 按 字 节 寻 址 的 内 存 ， 则 有 

nw 至 二 log，( 物 理 内 存 的 大 小 ， 以 字 节 计 ) 
例如 ， 如 果 物 理 内 存 大 小 是 1GB， 那 么 nya = 30 位 。 
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把 CPU 生成 的 线性 地 址 解释 为 虚拟 地 址 的 具体 方法 取决 于 内 存 系统 体系 结构 ( 即 ， 分 页 
还 是 分 段 )。 相 应 地 ， 物 理 地 址 的 计算 方式 也 要 变更 。 表 7-2 总 结 了 与 分 段 和 分 页 内 存 系统 相 
关 的 主要 公式 。 


表 7-2 分 段 和 分 页 内 存 系 统 中 的 地 址 计算 


.内存 系统 | meee . er 
分 段 I a ane aed 


段 编号 段 偏 移 量 段 起 始 地 址 9 = 段 表 [ 段 编号 ] 段 表 大 小 =2 
物理 地 址 = 段 起 始 地 址 + 段 偏 移 量 项 目 


Now = log2( 段 大 小 ) 
Nseg ig Deoup Not 


分 页 iiig e o 物理 帧 号 所 页 表 [ 虚拟 页 编号 ] 


物理 地 址 : 页 表 大 小 = 
虚拟 页 号 页 偏 移 量 $<" i | 2 虚拟 页 = 个 项 H 
Noir = log2( 页 大 小 ) 物理 帧 号 页 偏 移 量 


Nypy = Deu fot Nor = log2( 页 大 小 ) 


pFN 一 N 物理 一 呈 偏 移 量 





小 结 


内 存 系统 的 重要 性 怎么 强调 也 不 为 过 。 系 统 整体 的 性 能 关键 上 依赖 于 内 存 系统 的 效率 。 
组 成 内 存 系统 的 人 硬件 和 软件 之 间 的 交互 使 得 对 内 存 系统 的 研究 令 人 着 迷 。 迄 今 为 止 ， 我 们 讲 
了 若干 个 不 同 的 内 存 管理 方案 以 及 实现 这 些 方案 所 需 的 硬件 需求 。 在 本 章 的 开始 处 ， 我 们 找 
出 了 内 存 系统 的 四 个 标准 : 提高 资源 利用 率 、 进 程 内 存 空 间 的 独立 和 保护 、 从 内 存 资 源 限 制 
中 的 解放 ， 以 及 并 发 进程 的 内 存 共 享 。 从 操作 系统 管理 内 存 这 种 稀缺 资源 的 效率 的 角度 来 说 ， 
这 些 都 很 重要 。 从 关于 分 段 的 讨论 中 ， 我 们 给 内 存 管理 添加 了 另 一 个 同样 重要 的 评判 标准 ， 
即 促进 好 的 软件 工程 实践 。 这 个 标准 是 说 ， 内 存 管理 方案 除了 要 达到 系统 级 的 标准 以 外 ， 还 
要 能 帮助 我 们 开发 灵活 、 易 维护 、 持 续 发 展 的 软件 。 让 我 们 依照 这 些 标准 对 这 些 方案 进行 总 
结 。 表 7-3 给 出 了 这 些 内 存 管理 方案 的 定性 对 比 。 


表 7-3 ”内存 管理 方案 的 定性 对 比 


A 页 ` 
内 存 管理 标准 p-a 分 页 虚拟 内 存 | 分 段 虚拟 内 存 me 


提高 资源 利用 率 | 无 不 超过 分 区 大 | 外 部 碎片 不 超过 分 区 大 | 外 部 碎片 不 超过 分 区 大 
小 的 内 部 碎片 ; 小 的 内 部 碎片 小 的 内 部 碎片 
外 部 碎片 


syari Ja | 是 | 是 | 是 | 是 | 是 
从 资源 限制 中 解放 | 否 |a ee 
并 发 进程 的 共享 | 否 Je E | 是 | 是 | 是 
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日 ”这 是 通过 在 段 表 中 以 段 编号 为 索引 查找 得 到 的 。 
”类 似 地 ， 这 是 通过 在 页 表 里 以 虚拟 页 编号 为 案 引 查找 得 到 的 。 
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只 有 采用 页 式 分 段 的 虚拟 内 存 符合 所 有 标准 。 因 此 ， 有 必要 回顾 一 下 哪些 方案 在 当前 内 
仓 管理 的 前 沿 中 还 有 用 处 。 表 7-4 总 结 了 本 章 提 到 的 内 存 管理 方案 ， 以 及 所 需 的 硬件 支持 以 
及 它们 在 现代 系统 中 的 适用 性 。 


表 7-4 ”内存 管理 方案 总 结 


方案 是 否 仍 在 使 用 中 
用 户 / ABS a 
固定 分 区 未 使 用 在 任何 产品 操作 系统 中 
变 长 分 区 未 使 用 在 任何 产品 操作 系统 中 
分 页 虚拟 内 存 是 ， 在 绝 大 多 数 现代 系统 中 
分 段 虚拟 内 存 纯粹 的 分 段 未 使 用 在 任何 商业 上 流行 的 处 理 器 中 


页 式 分 段 虚 拟 内 存 分 页 和 分 段 的 硬件 的 组 合 是 ， 在 绝 大 多 数 基 于 Intel x86 的 操作 系统 中 @ 


历史 回顾 


KATE 1965 年 前 后 ，IBM 推出 了 System/360 系列 大 型 机 。 该 体系 结构 提供 了 基 址 和 限 
长 寄存 器 ， 也 就 为 支持 动态 重 定位 的 内 存 管理 铺 平 了 道路 。 任 何 一 个 通用 寄存 器 都 可 以 用 作 
基 址 寄存 器 。 编 译 器 则 会 选择 一 个 特定 的 寄存 器 来 用 作 基 址 寄存 器 ， 从 而 任何 以 高 级 语言 编 
写 的 程序 都 可 以 被 操作 系统 动态 重 定 位 。 但 是 ， 有 个 小 问题 。 程 序 员 可 以 找 出 哪个 寄存 器 被 
用 作 基 址 寄存 器 ， 便 可 以 利用 这 一 点 来 把 基 址 寄存 器 的 值 “ 藏 起 来 ”以 便 搬 和 人 该 高 级 语言 
序 的 汇编 代码 使 用 。 有 这 么 做 的 结果 就 是 程序 在 执行 之 后 就 不 再 能 重 定位 了 ， 因 为 程序 员 可 能 
已 经 在 程序 里 硬 编码 了 地 址 。 你 也 许 会 奇怪 ， 他 们 怎么 会 做 这 种 事情 呢 ? 对 于 追求 从 系统 中 
榨取 每 一 点 性 能 的 程序 员 来 说 ， 往 高 级 语言 代码 里 塞 进去 一 些 汇 编 代 码 实在 是 司空 见 惯 的 事 
情 。 我 们 当中 的 一 些 至 今 还 在 这 么 做 ! 由 于 这 些 原 因 ， 动 态 重 定 位 一 直 没 能 像 IBM 所 希望 的 
那样 良好 运行 。 主 要 的 原因 就 是 在 体系 结构 里 用 来 进行 地 址 偏 移 的 寄存 器 是 个 程序 员 可 见 的 
通用 寄存 器 。 

大 约 在 1970 年 前 后 ，IBM 在 它们 的 System/370 系列 大 型 机 中 引入 了 虚拟 内 存 。9 
System/370 与 System/360 本 质 上 的 不 同 之 处 就 是 体系 结构 文 持 动态 地 址 转换 ， 也 就 消除 
了 之 前 提 到 的 System/360 的 问题 。System/370 代表 了 IBM 第 一 次 对 虚拟 内 存 概念 的 支持 。 
System/370 系列 的 后 继 型 号 则 通过 扩展 寻 址 能 力 改 良 了 虚拟 内 存 模 型 。 该 体系 结构 采用 分 页 
虚拟 内 存 。 

在 这 个 语 境 下 ， 值 得 提 一 下 术语 静态 和 动态 的 使 用 随 着 操作 系统 或 者 体系 结构 的 定位 而 
略 有 不 同 。 早 期 时 (参见 7.2 节 ) 我 们 从 操作 系统 的 视角 定义 了 静态 和 动态 重 定位 是 什么 。 市 
着 这 个 定义 ， 你 可 以 说 如 果 硬 件 支持 在 运行 时 修改 虚拟 到 物理 的 映射 ， 该 程序 就 是 动态 可 重 
定位 的 。 根 据 这 个 定义 ，IBM 的 360 系列 的 基 址 加 限 长 寄存 器 是 支持 动态 重 定 位 的 。 

体系 结构 设计 师 则 以 更 细 粒 度 观 察 程序 运行 时 的 单个 内 存 访问 ， 使 用 术语 地 址 转换 。 如 
果 从 虚拟 到 物理 的 映射 可 以 在 程序 执行 的 任意 阶段 被 修改 ， 这 个 体系 结构 就 支持 动态 地 址 转 
换 。 根 据 这 个 定义 ，IBM 360 的 基 址 和 限 长 寄存 器 就 只 能 支持 静态 地 址 转换 ， 而 分 页 才 文 持 

O MYER, Intel 的 分 段 与 纯粹 形式 的 分 段 大 为 不 同 。 我 们 随后 将 会 讨论 Intel 的 页 式 分 段 方案 。 

© Æ Á University of Wisconsin-Madison 的 James R. Goodman 的 私人 通信 。 


© 想 要 阅读 描述 System/360 和 System/370 的 权威 论文 ， 请 参阅 www.research.ibm.com/journal/rd/255/ 
ibmrd2505D.pdf. 
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动态 地 址 转换 。 操 作 系 统 对 静态 和 动态 的 定义 是 从 整个 程序 来 说 的 ， 而 体系 结构 对 静态 和 动 
态 的 定义 则 是 从 单个 内 存 访问 来 说 的 。 

其 至 在 IBM 进入 虚拟 内 存 的 世界 之 前 ，Burroughs 公司 就 在 它们 的 B5000 系列 机 器 中 引入 
了 分 段 虚拟 内 存 的 概念 [Oliphint，1987]。 通 用 电气 与 MIT 的 MULTICS 项 目 合作 于 20 世纪 60 
年 代 中 叶 在 它们 的 GE 600 系列 机 需 中 引入 了 页 式 分 段 机 制 [Schroeder，1971]。IBM 通过 推出 
VM/370 操作 系统 以 支持 虚拟 内 存 ， 以 及 持续 不 断 地 对 System/370 系列 机 堪 的 分 页 虚拟 内 存 的 
改进 ， 迅 速 确立 了 20 世纪 60 和 20 世纪 70 年代 大 型 机 之 战 的 胜利 。 这 场 半 命 持续 到 今天 ， 你 
甚至 在 支撑 企业 级 应 用 IBM z 系列 大 型 机 S 中 仍然 能 看 出 它 与 早期 机 器 之 间 的 联系 。 


MULTICS 


有 些 学 术 性 的 计算 机 项 目 对 所 在 领域 的 发 展 一 直 保持 着 深远 的 影响 。MIT 的 MULTICS 
项 目 就 是 一 个 这 样 的 例子 。 该 项 目 源 自 20 世纪 60 年 代 ， 并 且 你 很 容易 就 能 看 出 我 们 所 知道 
的 计算 机 系统 中 有 很 多 东西 出 生 于 该 项 目 (UNIX、Linux、 分 页 、 分 段 、 安 人 全、 保护 ， 等 等 )。 
在 某 种 意义 上 来 说 ，MULTICS 项 目 中 提出 的 操作 系统 概念 超前 于 时 代 ， 而 那个 时 候 的 处 理 怖 
体系 结构 则 还 没有 准备 好 支持 MULTICS 所 鼓吹 的 内 存 保护 这 种 高 级 观点 。MULTICS 项 目 是 
本 书 主旨 的 绝 佳 例 子 ， 即 系统 软件 和 机 器 体系 结构 的 相连 性 。 

MULTICS 引入 了 页 式 分 段 的 概念 8。 图 7-20 Mi T MULTICS 所 实现 的 方案 。 


虚拟 地 址 





图 7-20 MULTICS 中 的 地 址 转换 


CPU 生成 的 36 位 虚拟 地 址 由 两 部 分 组 成 : 18 位 的 段 编号 (s) 和 18 位 的 段 内 偶 移 量 〈i)。 


O WEHE: www-03.ibm.com/system/z/. 
© B5LJRt6h) MULTICS 论文 : www.multicians.org/multics-vm.html, 
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每 个 段 都 可 以 任意 大 ， 只 要 不 超过 段 大 小 的 上 限 21 即 可 。 为 了 避免 外 部 碎片 ， 每 个 段 都 
由 页 组 成 (在 MULTICS 里 ， 页 的 大 小 是 1024 个 字 ， 每 字 36 位 )。 每 段 都 有 自己 的 页 表 。 在 
MULTICS 中 ， 动 态 地 址 转换 分 为 两 步 。 
© 定位 到 对 应 于 段 编 号 的 段 描述 符 : 硬件 通过 把 保存 在 一 个 叫做 描述 符 基 址 寄存 器 的 寄 
存 器 中 的 段 表 基 址 与 段 编号 相 加 以 进行 此 次 查找 。 
。 段 描 述 符 包含 该 段 页 表 的 基 址 。 根 据 虚 拟 地 址 中 的 段 偏 移 量 ， 以 及 页 大 小 ， 人 硬件 计算 
出 对 应 于 该 虚拟 地 址 的 特定 的 页 表 项 。 最 后 ， 通 过 连接 物理 页 编号 和 页 内 偏 移 量 (就 是 
段 内 偏 移 量 除 以 页 大 小 的 余数 )， 就 得 到 了 物理 地 址 。 
如 果 某 虚拟 地 址 中 段 编号 为 s8， 而 段 内 的 偏 移 量 为 1。 那 么 ,我 们 在 寻找 的 内 存 位 就 处 在 
该 段 的 第 p 个 页 的 偏 移 量 w 处 。 其 中 : 
w=1mod 1024 
p=(i-w)/ 1024 
图 7-20 展示 了 这 种 地 址 转换 的 过 程 。 


Intel 的 内 存 体系 结构 


Intel 的 Pentium 系列 处 理 器 也 采用 了 页 式 分 段 。 但 是 ， 它 的 组 织 结构 与 MULTICS AY fa 
单方 案 相 比 更 加 复杂 。 学 术 项 目 与 工业 产品 之 间 和 争论 的 实际 情况 之 一 就 是 ， 后 者 的 处 理 盘 系 
列 必须 得 考虑 它 的 辐 后 兼容 性 。 癌 后 兼容 性 意味 着 新 处 理 大 作为 之 前 型 号 的 后 继 者 ， 必 须 能 
够 运行 以 前 的 代码 ， 而 完全 不 需要 对 其 进行 修改 。 这 是 个 习 烦 事 ， 对 新 处 理 需 的 设计 造成 了 
很 多 限制 。Intel Pentium 当前 的 内 存 体系 结构 从 Intel 的 更 早期 的 x86 体系 结构 发 展 而 来 ， 比 
如 80286。 因 此 ， 它 保留 有 旧 处 理 器 中 的 分 段 机 制 ， 外 加 对 于 给 软件 开发 提供 大 量 虚拟 地 址 
的 美学 要 求 。 

我 们 有 意 对 本 节 的 讨论 进行 了 简化 。 作 为 一 种 近似 ， 虚 拟 地 址 是 段 选择 万 加 上 偶 移 量 
(参见 图 7-21 ) Intel 的 体系 结构 把 总 的 段 空间 分 成 两 半 : 系统 和 用 户 。 系 统 段 对 于 所 有 进程 
来 说 是 共通 的 ， 而 用 户 段 则 每 个 进程 各 不 相同 。 你 可 能 已 经 猜 到 了 ， 由 于 对 所 有 进程 都 一 样 ， 
系统 段 是 给 操作 系统 用 的 。 对 应 的 是 ， 有 一 个 对 所 有 进程 都 一 样 的 描述 符 表 ， 称 作 全 局 描 
i& # # (Global Descriptor Table，GDT)， 还 有 一 个 每 个 进程 独 有 的 表 ， 称 作 局 部 描述 符 表 
( Local Descriptor Table, LDT), Intel 中 的 段 选择 句 类 似 于 MULTICS 中 的 段 编号 ， 只 有 一 个 
区 别 : 段 选择 器 中 有 一 个 位 表示 该 虚拟 地 址 所 用 到 的 段 名 是 系统 段 还 是 用 户 段 。 

和 在 MULTICS 中 一 样 ， 选 定 段 的 段 描 述 符 包含 用 来 把 虚拟 地 址 中 指定 的 偏 移 量 转换 成 
物理 地 址 的 详细 信息 。 这 里 的 区 别 是 可 以 选择 是 使 用 不 带 任 何 分 页 的 简单 分 段 (以 与 更 早 的 
处 理 器 相 兼 容 ) 还 是 使 用 段 页 式 管理 。 这 可 以 从 图 7-21 中 看 到 。( 地 址 转换 是 采用 GDT 还 是 
LDT 是 由 选择 器 的 用 户 / 系统 位 来 决定 的 。) 计算 出 来 的 实际 地 址 就 是 物理 地 址 。 在 页 式 分 段 
的 情形 中 ， 描 述 符 中 存储 的 基 址 是 对 应 于 此 段 编号 的 页 表 基 地 址 。 地 址 转换 的 剩余 部 分 和 我 
们 之 前 给 MULTICS 描述 的 一 样 ， 通 过 选 定 段 的 页 表 进 行 转换 (参见 图 7-20 )。 某 个 全 局 控制 
寄存 器 用 来 控制 是 采用 纯 分 段 还 是 页 式 分 段 。 

如 果 你 想 了 解 更 多 关于 Intel 的 虚拟 内 存 体 系 结构 的 知识 ， 请 参阅 Intel 的 系统 编程 
指南 9。 


© Intel® 64 and IA-32 Architectures Software Developer's Manual Volumn 3A: System Programming Guide [Intel 
System programming guide 3A, 2008]. 
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图 7-21 在 Intel Pentium 中 采用 纯 分 段 的 地 址 转换 313 
练习 题 
1. 内 存 管理 的 主要 目标 有 哪些 ? 


2. 说 出 你 是 支持 还 是 反对 以 下 观点 ， 并 给 出 理由 : 既然 内 存 很 便宜 ， 而 且 我 们 能 和 弄 到 很 多 内 存 ， 也 就 不 
再 需要 内 存 管理 了 。 
3. 比较 并 说 出 内 部 和 外 部 碎片 的 异同 。 
4. 内 存 管理 器 以 固定 的 2048 字 节 大 小 为 单位 分 配 内 存 。 当 前 的 分 配 结果 如 下 所 示 : 
P1 1200 字 节 
P2 2047 字 节 
P3 1300 字 节 
P4 1 字 节 
根据 以 上 分 配 结果 ， 请 问 由 于 内 部 分 配 总 共 浪 费 了 多 少 内 存 ? 
5. 判断 正 误 ， 并 给 出 理由 : 内 存 缩 并 通常 是 与 固定 尺寸 分 区 的 内 存 分 配方 案 一 起 用 的 。 
6. 判断 正 误 ， 并 给 出 理由 : 用 基 址 和 限 长 寄存 器 来 进行 管理 ， 与 用 界限 寄存 器 相 比 ， 没 有 什么 特别 的 好 处 。 
7. 假设 某 体系 结构 用 基 址 和 限 长 寄存 器 进行 内 存 管理 。 内 存 管理 器 采 用 变 长 分 区 分 配 。 当 前 的 内 存 分 配 
如 下 所 示 : 
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有 个 需要 9KB 内 存 的 新 申请 。 此 次 申请 能 和 否 被 满足 ?” 如 果 不 能 的 话 ， 为 什么 ?图 中 所 表示 的 情 

形 中 外 部 碎片 的 量 是 多 少 ? 

8. 在 分 页 内 存 系统 中 页 大 小 与 帧 大 小 有 什么 联系 ? 

9. 从 所 需 硬 件 资源 (新 增 的 处 理 器 寄存 器 个 数 ， 以 及 用 来 针对 给 定 的 CPU 生成 的 内 存 地 址 计算 出 物理 
内 存 地 址 的 额外 电路 ) 这 个 角度 ， 对 比 基 址 加 限 长 寄存 器 与 分 页 虚拟 内 存 这 两 个 解决 方案 的 异同 。 

10. 分 页 虚拟 内 存 系统 为 什么 能 消除 外 部 碎片 ? 

11. 推导 分 页 内 存 系统 在 页 大 小 为 p 的 情况 下 的 最 大 内 部 碎片 。 

12. 一 个 系统 中 虚拟 地 址 有 20 位 ， 页 大 小 为 1KB。 页 表 中 有 多 少 项 ? 

13. 一 个 系统 中 物理 地 址 为 24 位 ， 页 大 小 为 8SKB。 物 理 帧 的 最 大 数目 是 多 少 ? 

14. 说 出 分 页 虚拟 内 存 和 分 段 虚拟 内 存 的 差别 。 

15. ASU FER: 


0 
1 
2 
3 





对 应 于 以 下 虚拟 地 址 的 物理 地 址 是 多 少 ? 


16. 从 所 需 硬件 资源 (新 增 的 处 理 器 寄存 器 个 数 ， 以 及 用 来 针对 给 定 的 CPU 生成 的 内 存 地 址 计算 出 物理 
内 存 地 址 的 额外 电路 ) 这 个 角度 ， 对 比分 页 和 分 段 的 内 存 系统 的 异同 。 


参考 文献 注释 和 扩展 阅读 


Elliot Organick 的 书 [Organick，1972] 是 一 本 很 好 的 历史 文献 ， 其 中 介绍 了 MULTICS 项 目 。 该 项 
目 探索 了 包括 页 式 分 段 在 内 的 若干 个 先锋 想法 ， 历 经 了 时 间 的 考验 。IBM 在 内 存 系统 发 展 中 所 扮演 的 
角色 在 [IBM system/360，1964] 和 [IBM System/370，1978] 中 有 记载 。[Intel System programming guide 

3A, 2008] 是 关于 Intel 的 内 存 体系 结构 的 一 份 良 好 的 文档 。 
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页 式 内 存 管 理 





本 章 我 们 主要 讨论 页 式 内 存 管理 ( page-based memory management)。 这 项 技术 对 于 支持 
虚拟 内 存 的 绝 大 多 数 处 理 帮 和 操作 系统 都 很 重要 。 正 如 前 文 提 到 的 ， 即 使 是 支持 段 式 管理 的 
处 理 右 (如 英特尔 奔腾 处 理 右 ) 也 使 用 页 式 管理 来 消除 外 部 碎片 。 


8.1 ENN 


正如 我 们 在 第 7 章 中 提 到 的 ， 程 序 局 动 时 内 存 管理 融会 为 处 理 需 建立 一 个 页 表 。 我 们 首 
先 来 弄 明日 程序 启动 时 内 存 管理 融 在 内 存 中 分 配 整 个 程序 的 哪些 部 分 。 生 成 的 程序 包含 应 用 
程序 的 功能 部 分 和 算法 逻辑 部 分 ， 以 及 在 程序 执行 过 程 中 出 现 错误 的 情况 下 的 非 功能 部 分 。 
这 样 ， 可 以 预测 对 运行 情况 良好 的 程序 ， 只 在 内 存 加 载 整 个 程序 中 很 小 的 一 部 分 就 可 以 正常 
执行 。 所 以 ， 当 程序 局 动 时 内 存 管理 融 不 将 整个 程序 加 载 进 内 存 是 一 件 需要 谨慎 考虑 的 事情 。 
这 需要 对 在 内 存 中 执行 一 个 不 完整 的 程序 意味 着 什么 有 


深入 的 理解 和 思考 。 基 本 想法 是 加 载 那些 不 在 内 存 中 但 | wy | 
又 有 需要 的 程序 部 分 。 这 种 按 需 分 页 的 技术 会 有 更 好 的 


内 存 利用 率 。 图 8-1 页 表 项 。 按 需 分 页 需要 在 页 表 
首先 ， 让 我 们 来 了 解 按 需 分 页 在 硬件 和 软件 上 都 发 项 中 添加 一 个 有 效 位 
生 了 什么 。 


8.1.1 BATA 


在 第 7 章 中 ( 见 7.4.1 节 )， 我 们 提 到 硬件 从 页 表 中 选取 物理 帧 号 (PFN) 作为 地 址 转换 
的 一 部 分 。 但 对 于 按 需 分 页 ， 页 也 许 还 没有 加 装 到 内 存 中 。 所 以 我 们 需要 页 表 中 的 额外 信息 
来 了 解 页 是 否 在 内 存 中 。 我 们 向 每 个 页 表 项 添加 一 个 有 效 位 。 如 果 有 效 位 是 1 就 说 明 这 项 
的 PFN 字段 是 有 效 的 ; 否则 是 无 效 的， 表示 页 面 不 在 内 存 中 。 图 8-1 展现 了 文 持 按 需 分 页 的 
PTE。 硬 件 所 扮演 的 角色 是 识别 出 无 效 的 PTE 并 帮助 操作 系统 执行 正确 的 操作 ， 即 向 内 存 加 
载 缺 失 的 页 。 这 一 情况 (PTE 无 效 ) 是 一 个 程序 中 断 意外 ， 因 为 在 原 程序 中 是 没有 错误 的 。 操 
作 系 统 为 了 节省 内 存 资源 决定 不 加 载 这 部 分 程序 ， 这 种 程序 中 断 表 现 为 页 错误 异 第 或 陷入 。 

操作 系统 通过 从 磁盘 引入 缺失 页 来 处 理 这 种 错误 。 一 旦 页 被 加 载 进 内 存 ， 程 序 会 准备 好 
从 缺失 处 恢复 执行 。 所 以 ， 为 了 支持 按 需 分 页 ， 处 理 需 应 该 能 够 重新 局 动 那些 在 执行 过 程 中 
由 于 页 错误 被 暂停 的 指令 。 

图 8-2 表示 处 理 器 流水 线 。IF 和 MEM 阶段 因为 涉及 内 存 访问 所 以 很 容易 受到 页 错误 的 
影 啊 。 

为 指令 重启 的 硬件 ”我 们 首先 来 理解 在 硬件 中 会 发 生 什 么 。 假 设 指令 在 MEM 阶段 有 
一 个 页 错误 ， 并 且 在 流水 线 局 部 执行 中 有 一 些 指 令 。 在 处 理 器 进入 INT 阶段 解决 中 断 问题 前 
(参见 第 4 章 硬 件 如 何在 INT 阶段 解决 中 断 问题 )， 必 须 注 意 那 些 已 经 在 流水 线 局 部 执行 中 的 
指令 。 在 第 5 章 ， 我 们 简要 地 提 及 了 流水 线 处 理 器 处 理 中 断 的 措施 。 指 令 了 在 MEM 阶段 经 
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历 的 页 错误 异常 也 是 相同 的 。 处 理 器 会 完成 1 指令 并 且 在 进入 INT 阶段 前 压缩 指令 I，~ I 的 
执行 。 为 了 在 页 错误 之 后 能 够 重启 指令 ，INT 状态 需要 保存 涉及 指令 L 的 PC 值 。 注 意 , A 
前 为 止 压缩 指令 I ~ I; 没有 坏处 ， 因 为 它们 没有 改变 程序 的 持久 状态 (在 处 理 器 的 寄存 器 和 
内 存 中 )。 页 错误 存在 一 个 有 趣 并 且 关 键 的 副作用 (任何 其 他 的 异常 也 会 这 样 ): 流水 线 寄 存 器 
( 见 图 8-2 中 的 缓冲 区 ) 包含 异常 ( EX 阶段 的 运算 或 者 MEM 阶段 的 页 错误 ) 事件 里 指令 执行 
时 的 PC 值 。 我 们 在 第 5 章 已 经 讨论 了 在 流水 线 处 理 硕 中 人 处理 陷入 和 异常 的 硬件 后 果 。 






指令 输入 指令 输出 


图 8-2 ”处理 器 流水 线 潜在 的 页 错误 。IF Al MEM 阶段 访问 内 存 操作 数 ， 所 以 容易 遇 到 页 错误 


8.1.2 页 错误 处 理 程序 


页 错误 处 理 程序 和 前 面 讨论 过 的 其 他 中 断 处 理 程序 很 类 似 。 我 们 知道 任何 处 理 程序 都 需 
要 采取 的 基本 措施 (状态 保存 /状态 恢复 ) ; 我 们 在 第 4 章 已 经 7 了解 过 。 在 这 里 ， 我们 关心 处 
理 程序 为 了 纠正 页 错误 会 进行 哪些 具体 工作 : 

1 ) 搜索 一 个 空闲 的 页 帧 。 

2 ) 从 磁盘 向 空闲 页 帧 加 载 出 错 的 虚拟 页 。 

3 ) 为 缺 页 异常 进程 更 新 页 表 。 

4) 重新 将 进程 控制 块 (PCB) 放 和 调度 器 的 准备 好 队列 。 

在 接 下 来 的 章节 中 我 们 将 讨论 这 些 细 站 。 
8.1.3 ” 按 需 分 页 内 存 管理 的 数据 结构 

现在 我 们 来 探讨 按 需 分 页 的 数据 结构 和 算法 。 首 先 来 看 数据 结构 。 我 们 知道 页 表 是 内 存 管 理 需 
维护 的 针对 每 个 进程 的 数据 结构 。 除 了 应 用 了 页 表 ， 内 存 管理 右 针 对 页 错误 也 用 如 下 数据 结构 : 

1 ) 空闲 页 帧 表 ”这 个 数据 结构 包含 内 存 管理 器 目前 没有 用 到 的 页 帧 信息 ， 这 些 页 帧 都 用 
来 处 理 页 错误 。 空 闲 页 帧 表 不 包括 本 身 ; 空闲 页 帧 表 中 的 每 个 节点 仅 包含 页 帧 号 。 例 如 〈 见 
图 8-3 )， 页 帧 S2，20，200，…，8 是 目前 没有 使 用 的 页 帧 号 。 所 以 ， 内 存 管理 需 可 以 使 用 列 
表 中 的 任何 页 帧 来 处 理 一 个 页 错误 。 注 意 ， 当 机 需 局 动 时 ， 因 为 没有 用 户 进 程 ， 空 闲 列 表 包 
含 用 户 空间 的 所 有 页 帧 。 内 存 管理 需 会 分 配 和 释放 内 存 ， 空 闲 列 表 针 对 进程 的 页 错误 会 随 之 


减少 或 增加 。 
空闲 页 帧 表 


图 8-3 空闲 页 帧 表 。 这 些 是 内 存 管理 器 用 于 处 理 页 错误 的 空闲 帧 


2) 页 帧 表 (FT, Frame table) 这 个 数据 结构 包含 反 回 映射。 给 定 一 个 页 帧 号 ， 页 帧 表 将 
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返回 进程 ID(PID) 和 目前 占用 页 帧 的 虚拟 页 号 (OLA 8-4 )。 例 如 ， 页 帧 1 目前 处 于 空闲 状态 ， 


而 页 帧 6 被 进程 4 的 虚 页 0 占用 。 接 下 很 快 来 
会 讨论 内 存 管理 器 如 何 用 这 种 数据 结构 。 

3 ) 磁盘 映射 (DM，Disk map) 这 种 数 
据 结构 将 进程 的 虚拟 空间 映射 到 包含 页 内 容 rm rn 
( 见 图 8-5) 的 磁盘 位 置 上 。 磁 盘 映 射 和 页 表 类 | 
似 ， 每 个 进程 都 有 一 个 这 样 的 数据 结构 。 

为 了 讨论 清楚 ， 我 们 展示 的 每 个 给 定 的 数 
据 结 构 互 不 相同 。 通 常 内 存 管理 器 会 为 了 提高 





效率 或 因为 它们 有 相同 的 数据 结构 而 合并 其 中 
的 一 些 数据 结构 ， 并 通过 多 种 角度 的 观察 来 模 
拟 功 能 行为 。 在 我 们 讨论 页 蔡 换 策略 之 后 会 有 
更 好 的 理解 (UL 8.3 市 )。 


图 8-4 ”页 帧 表 。 这 是 内 存 管理 天 用 于 反 辐 查询 
的 数据 结构 ， 例 如 ， 给 定 一 个 页 帧 ， 通 
过 这 个 页 帧 表 会 找到 对 应 的 进程 和 虚 页 


进程 P1 的 磁盘 映射 
0 


2 


VPN 


i 





1 
3 
4 
5 
6 
图 8-5 HEFE P1 的 磁盘 映射 。 这 种 数据 绪 构 允许 内 存 管理 器 通过 磁盘 块 定 位 反 回 查找 进程 的 虚 页 


8.1.4 页 错误 解析 


让 我 重新 来 看 页 错误 异常 处 理 程序 发 现 页 错误 时 是 如 何 通过 下 面 的 数据 结构 工作 的 。 

1) 发 现 一 个 空闲 页 帧 ”页 错误 处 理 程序 (内 存 管理 需 的 一 部 分 ) ARS ARMA. WR 
页 表 是 空 的 则 出 现 问题 ， 这 意味 着 所 有 的 物理 页 帧 都 被 使 用 了 。 然 而 ， 为 了 保证 缺 页 的 进程 
能 够 继续 运行 ， 内 存 管理 器 不 得 不 将 缺失 的 页 从 磁盘 装 人 实际 物理 内 存 中 。 这 意味 痢 我 们 要 
在 物理 内 存 中 为 缺失 的 页 留 出 空闲 空间 。 所 以 ， 内 存 管 理 器 会 挑 出 一 些 物理 页 帧 作为 被 蔡 换 
页 ， 用 于 处 理 缺 失 的 页 。 关 于 被 替换 页 的 选择 策略 在 8.3 节 进 行 讨论 。 

2) 挑选 被 替换 页 ”在 选择 被 替换 页 帧 的 过 程 中 ， 内 存 管理 器 决定 包含 被 替换 页 的 被 蔡 换 
进程 。 页 帧 表 在 做 决定 时 就 会 派 上 用 场 。 我 们 要 区 分 干净 页 和 脏 页 的 概念 。 干 净 页 指 的 是 程 
序 从 磁盘 引入 内 存 中 就 再 也 没有 被 改变 的 页 面 ， 所 以 ,磁盘 中 对 应 的 部 分 和 干净 页 是 一 样 的 。 
另 一 方面 ， 脏 页 指 的 是 程序 从 磁盘 中 引入 内 存 后 改变 过 的 页 面 。 如 果 被 蔡 换 页 是 干净 页 ， 内 
存 管理 器 要 做 的 是 将 页 表 项 (PTE) 中 的 有 效 位 设 为 无 效 ， 即 这 一 页 的 内 容 不 需要 保存 。 然 
而 ， 如 果 这 一 页 是 脏 页 ， 内 存 管 理 器 需要 通过 被 蔡 换 进程 的 磁盘 映射 来 获取 磁盘 地 址 信息 ， 
将 此 页 写 回 磁盘 中 (通常 指 冲刷 到 磁盘 ，fushing to the disk), 

3) 加 载 缺 失 页 ”内存 管 理 器 通过 缺 页 异常 进程 的 磁盘 映射 从 磁盘 中 读 出 缺失 的 页 并 保存 
在 选 定 的 页 帧 中 。 
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4 ) 为 缺 页 异常 进程 和 帧 表 更 新 页 表 PHA AHR BUEN PTE 的 映射 指向 被 选 
中 的 页 帧 ， 并 将 有 效 位 设 为 有 效 。 同 时 也 要 更 新 帧 表 来 处 理 页 帧 映射 的 变化 。 

5 ) 重启 缺 页 异常 进程 ”此 时 缺 页 异常 进程 已 经 准备 好 了 重新 启动 。 内 存 管 理 器 将 缺 页 异 
第 进程 的 控制 块 (PCB) 放 人 调度 器 的 准备 好 队列 中 。 
假定 进程 Pl 正在 执行 ， 在 虚拟 页 码 (VPN) 为 20 的 地 方 经 历 了 一 个 页 错误 ， 而 空闲 页 帧 表 是 
空 的 ， 管 理 器 选择 页 帧 号 PFN=52 作为 被 替换 帧 。 这 个 帧 目前 在 进程 4 中 编号 为 33。 图 8-6a 和 图 8-6b 
演示 了 处 理 页 错误 前 后 页 表 和 页 帧 表 的 变化 情况 。 






页 帧 表 


<PID, VPN> 
<P3, 37> 





页 帧 表 


FN 



















图 8-6 a) 进程 P1 正在 执行 ， 并 且 虚 页 号 为 20 图 8-6 b) 进程 1 的 页 错误 处 理 完成 
的 地 方 出 现 页 错误 


给 定 发 生 页 错误 前 页 管理 器 的 数据 结构 ， 显 示 在 P1 进程 中 会 在 VPN=2 的 地 方 发 生 页 错误 。 被 
替换 页 帧 经 页 替换 算法 计算 选 定 为 PEN=84。 注 意 下 图 中 只 显示 了 页 帧 表 中 涉及 的 项 。 
发 生 页 错误 前 的 结构 





页 帧 表 
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处 理 完 Pl 进程 VPN=2 处 的 页 错误 的 数据 结构 的 内 容 
e, 


A « 
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注意 ， 页 错误 处 理 程序 和 其 他 用 户 进程 一 样 也 是 一 段 代 码 。 然 而 ， 不 允许 页 错误 处 理 程 
序 本 身 发 生 页 错误 。 操 作 系统 会 确保 操作 系统 中 特定 的 部 分 ， 如 页 错误 处 理 程 序 ， 一 直 保 存 
在 内 存 中 ( 即 不 会 从 物理 内 存 中 去 除 )。 


当 内 存 中 没有 空闲 帧 发 生 页 错误 时 会 执行 下 面 7 个 操作 中 的 5 个。 选择 其 中 5 项 正确 的 操作 并 
识别 出 其 他 2 个 不 正确 的 操作 。 
a. 利用 页 帧 表 发 现 有 页 错误 的 进程 。 
b. 利用 缺 页 异常 进程 的 磁盘 映射 从 磁盘 中 向 被 蔡 换 帧 装 入 缺失 的 页 。 
c. 选择 一 个 被 替换 的 页 用 作 替 换 (和 相关 的 被 替换 帧 )。 
d. 更 新 缺 页 异常 进程 的 页 表 和 页 帧 表 来 反映 被 替换 帧 的 映射 变化 。 
e. 如 果 是 脏 页 ， 通 过 被 替换 进程 的 磁盘 映射 将 被 蔡 换 页 写 回 磁盘 。 
f 查找 页 帧 表 识别 出 被 替换 进程 并 设置 被 替换 页 表 中 被 替换 页 的 有 效 位 为 无 效 。 
g. 检测 缺失 的 页 是 否 在 物理 内 存 中 存在 。 
答 : 
第 1 步 : c 
第 2 步 : f 
第 3 步 ; e 
BAX: b 
第 5 步 : d (注意 : 只 要 其 他 步骤 的 相对 顺序 保持 不 变 ， 这 一 步 也 许 会 出 现在 第 3 步 或 第 5 步 。) 
操作 a 和 g 不 属于 页 错误 处 理 过 程 。 


8.2 ”进程 调度 器 和 内 存 管理 怖 间 交 互 


图 8-7 演示 了 CPU 调度 器 和 内 存 管 理 器 之 间 的 交互 。 在 任何 情况 下 ，CPU 或 者 执行 
一 项 用 户 进程 ， 或 者 执行 操作 系统 下 子 系统 中 的 一 项 操作 ， 如 CPU 调度 ， 或 者 进行 内 存 管 
理 。 调 度 器 、 内 存 管理 器 和 其 他 所 有 涉及 数据 结构 的 程序 代码 都 会 保存 在 内 核 内 存 空间 中 
(ULE 8-7 )。 用 户 进 程 保存 在 用 户 内 存 空 间 中 。 一 旦 CPU 调度 器 分 配 一 个 进程 ， 它 会 一 直 运 [324 
行 ， 直 到 下 面 的 事件 发 生 : 
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1) 硬件 计时 需 中 断 CPU， 可 能 会 产生 一 个 用 于 进程 上 下 文 切 换 的 CPU 调度 器 的 回调 
(图 中 1 )。 回 调 ( 见 第 6 章 ) 指 从 系统 软件 的 较 低 层 向 较 高 层 的 一 项 功能 调用 。CPU 调度 器 会 
采取 恰当 的 措施 调度 CPU 的 下 一 个 进程 。 

2 ) 进程 发 生 页 错误 ,产生 一 个 内 存 管 理 需 的 回调 ( 见 图 中 的 2 )， 用 于 处 理 前 文中 提 及 的 
页 错误 。 

3) 进程 发 出 系统 调用 (例如 请 求 VO 操作 )， 导 致 另 一 个 子 系统 (图 中 未 标明 ) 回调 并 采 
取 相应 措施 。 

虽然 这 3 种 事件 处 于 操作 系统 的 不 同 阶段 ， 它 们 共享 PCB 的 数据 结构 ， 这 些 综合 起 来 就 
是 目前 进程 的 状态 。 





计时 器 中 渐 (1) 页 错误 (2) 


图 8-7 CPU 调度 器 和 内 存 管 理 咒 建 的 交互 。 除 了 计时 句 中 断 ，CPU 在 探测 目前 分 配 的 
进程 是 否 出 现 页 错误 的 情况 下 也 会 回调 操作 系统 


8.3 页 替换 策略 


现在 我 们 来 讨论 当 发 生 页 错误 并 且 空 闲 页 帧 表 为 空 时 如 何 从 物理 内 存 中 选 出 被 替换 页 。 


如 何 从 物理 内 存 中 选 出 一 个 被 蔡 换 页 的 过 程 叫做 页 蔡 换 策略 。 我 们 首先 来 了 解 好 的 页 蔡 换 策 
略 会 有 哪些 特性 。 


1) 对 于 给 定 的 连续 的 页 访问 ， 该 策略 能 产生 最 少 的 页 错误 。 这 项 特性 也 保证 了 操作 系统 


中 处 理 页 错误 耗费 时 间 的 降低 。 


2 ) 理想 情况 下 ， 一 旦 特定 的 页 引入 物理 内 存 ， 该 策略 应 该 努力 确保 相同 的 页 不 再 发 生 页 


错误 。 这 项 特性 保证 了 页 错误 处 理 程序 会 顾及 用 户 程序 的 访问 模式 。 


在 选择 一 个 被 蔡 换 页 时 ， 内 存 管理 右 有 2 个 选择 : 

。 局 部 被 替换 选择 ”思路 是 从 缺 页 进程 中 抽取 物理 帧 做 替换 ， 来 满足 缺 页 请 求 ， 具 有 一 定 
的 简洁 性 。 例 如 ， 这 种 策略 不 需要 页 帧 表 。 然 而 ， 局 部 替换 会 导致 较 低 的 内 存 利用 率 。 

。 全 局 被 替换 选择 ”思路 是 从 所 有 进程 的 帧 中 选择 一 个 物理 帧 ， 而 不 需要 是 发 生 缺 页 弄 
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常 的 进程 中 。 具 体 选择 哪个 被 替换 进程 和 被 替换 页 取决 于 具体 的 算法 。 由 于 是 在 全 局 

范围 内 选择 被 替换 页 ， 这 种 策略 会 有 不 错 的 利用 率 。 

我 们 用 全 局 被 替换 选择 来 改善 内 存 的 利用 情况 。 理 想 情 况 下 ， 如 果 没 有 页 错误 ， 内 存 管 
理 器 永远 不 会 被 调用 ， 并 且 处 理 器 在 绝 大 多 数 时 间 都 会 执行 用 户 程序 (除了 上 下 文 切换 的 情 
况 之 外 )。 所 以 ， 降 低 页 错误 率 是 任何 内 存 管理 器 的 目标 。 有 以 下 两 个 原因 使 得 内 存 管理 器 需 
要 降低 页 错误 率 : (1 ) 因为 发 生 页 错误 时 从 下 一 级 存储 读 取 页 会 很 耗 时 ， 这 样 会 严重 影响 程 
序 的 性 能 ; (2) 宝贵 的 处 理 器 循环 不 应 该 频频 用 在 类 似 页 替换 这 样 的 开销 上 。 

在 余下 的 讨论 中 都 默认 采用 全 局 页 替换 策略 ， 尽 管 为 了 简单 起 见 所 举 的 例子 主要 集中 在 
单 进程 的 页 调度 行为 上 。 内 存 管 理 器 基于 进程 的 页 面 调度 进行 被 蔡 换 页 的 选择 。 所 以 ， 当 我 
们 提 及 一 个 页 时 ， 指 的 是 虚 页 。 一 旦 内 存 管理 器 确定 一 个 虚 页 是 被 替换 页 ， 保 存 此 虚 页 的 物 
理 帧 将 作为 被 替换 选择 。 对 于 每 种 页 替换 策略 ， 如 果 有 必要 我 们 会 确定 出 所 需 的 硬件 支持 、 
所 需 的 数据 结构 、 算 法 的 细节 和 不 同 缺 页 错误 数目 预期 的 性 能 。 


8.3.1 Belady 的 Min 算法 


如 果 知 道 示 来 这 些 页 被 访问 的 情况 ， 那 么 选择 蔡 换 那些 未 来 最 长 时 间 内 不 会 被 访问 的 页 
是 最 好 的 选择 。 这 种 蔡 换 策略 不 可 行 ， 因 为 内 存 管理 圳 并 不 知道 未 来 某 个 进程 的 访问 情况 。 
IRM, Æ 1966 年 ，Laszlo Belady 提出 了 有 最 优 替换 算法 〈optimal replacement algorithm )， 命 名 
为 Belady 的 Min 算法 。 这 个 算法 后 来 成 为 评价 任何 页 替换 算法 性 能 的 基准 。 


8.3.2 MEMEK 


最 简单 的 策略 是 页 面 随机 替换 。 乍 一 看 ， 这 也 许 不 是 一 个 很 好 的 方法 。 这 种 策略 的 优 
点 是 内 存 管理 器 不 需要 任何 硬件 支持 ， 也 不 需要 保存 当前 页 的 细节 信息 (如 时 间 截 或 访问 顺 
序 )。 在 对 未 来 未 知 的 情况 下 ， 了 解 随 机 策略 对 任意 顺序 访问 的 性 能 分 析 是 很 有 价值 的 。 正 如 
Belady 的 Min 算法 是 页 替换 策略 性 能 的 上 限 一 样 ， 随 机 替换 可 以 作为 替换 策略 性 能 的 下 限 。 
换 名 话说， 如 果 一 个 页 替换 策略 要 求 有 硬件 支持 或 者 需要 内 存 管理 器 维护 细节 信息 ， 它 应 该 
比 随 机 策略 表现 得 要 好 ， 否 则 就 没 必 要 增加 额外 开销 。 实 际 应 用 中 ， 内 存 管理 器 在 没有 足够 
多 的 细节 信息 做 决定 时 都 会 默认 使 用 随机 蔡 换 算法 (IL 8.3.4 节 )。 


8.3.3 ”先进 先 出 策略 


这 是 最 简单 的 页 替换 策略 之 一 。 先 进 先 出 (FIFO, First In First Out) 算法 如 下 : 

。 当 一 个 页 装 入 物理 内 存 时 添加 一 个 时 间 戳 。 

。 如 果 有 页 需要 替换 ， 选 择 时 间 惟 最 久 的 页 面 作为 被 蔡 换 页 。 

有 趣 的 是 ， 对 于 此 策略 我 们 不 需要 任何 硬件 支持 。 我 们 稍 后 将 看 到 ， 内 存 管理 顶 会 用 它 
的 数据 结构 记录 页 存 人 物理 内 存 的 顺序 。 

我 们 首先 来 理解 内 存 管 理 器 需要 的 数据 结构 。 内 存 管理 器 用 队列 记录 人 存 人 物理 内 存 中 
页 面 的 存 人 顺序 来 模拟 时 间 惟 。 我 们 用 一 个 带头 指针 和 尾 指 针 的 循环 队列 来 进行 模拟 ( 见 
图 8-8， 头 指针 和 尾 指针 均 初 始 化 为 0 )。 我 们 向 队 尾 插入 元 素 。 所 以 驻 留 时 间 最 长 的 页 面 是 
在 队 首 的 页 面 。 此 外 ， 内 存 管理 器 还 设置 队 满 标 志 (full flag， 初 始 化 为 false) 来 指示 队列 是 
否 满 。 队 列 中 所 表示 的 元 素 是 当前 内 存 中 正在 使 用 的 物理 帧 。 所 以 ， 我 们 要 将 队列 的 长 度 设 
置 为 实际 物理 内 存 能 够 容纳 的 总 帧 数目 。 循 环 队列 中 的 每 个 元 素 都 和 一 个 特定 的 物理 帧 对 应 。 
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初始 时 队列 为 空 ( 队 满 标志 位 为 false)， 表 示 所 有 的 物理 帧 都 没有 被 使 用 。 随 着 内 存 管理 器 按 
需 分 页 的 进行 ， 会 分 配 物理 页 帧 来 满足 页 错误 需求 (每 做 一 次 分 配 就 增加 一 个 队 尾 元 素 )。 当 
没有 额外 的 页 帧 进行 分 配 的 时 候 ( 关 和 尾 指 针 相 等 ) 就 认为 队列 满 了 ( 队 满 标志 位 为 true)。 
这 种 情况 下 如 果 出 现 页 错误 会 进行 页 替换 。 内 存 管理 器 会 替换 队 首 的 页 ， 因 为 它 的 驻 留 时 间 
最 入 。 需 要 注意 的 是 循环 队列 同时 起 到 了 空闲 页 帧 表 和 页 帧 表 的 作用 。 

循环 队列 


图 8-8 先进 先 出 页 替换 策略 的 循环 队列 图 。 尾 指针 指向 保存 第 一 个 空闲 物理 页 帧 的 序 
号 。 每 个 队列 项 都 和 一 个 物理 页 帧 相对 应 ， 同 时 保存 页 帧 的 <PID, VPN> (进程 
号 和 虚 页 号 )。 队 首 保存 驻 留 时 间 最 长 页 。 





假设 进程 访问 一 系列 的 页 : 
访问 编号 : 1 2 3 4 5 6 7 8 9 10 11 12 13 
EAS: 9 0 3 4 0 5 0 6 4 5 0 5 4 
假设 有 3 个 物理 页 帧 ， 用 类 似 图 8-8 的 循环 队列 来 显示 前 6 个 页 面 访 问 的 队列 状态 。 
答 : 
初始 时 ， 循 环 队 列 如 下 : 


循环 队列 





当 出 现 页 错误 时 ,通过 队 尾 指针 插入 新 页 。 类 似 地 ， 被 蔡 换 页 也 是 队 首 指针 所 指 的 页 面 ， 因 为 
对 于 FIFO 策略， 队 首 指针 总 是 指 着 最 先进 来 的 页 面 。 一 旦 选中 被 替换 页 ， 队 首 指 针 将 指向 下 一 个 
FIFO 候选 者 。 当 队列 满 时 ， 队 首 指 针 和 队 尾 指针 都 需要 移动 来 处 理 一 个 缺 页 异常 。 下 面 的 数据 结构 
快照 表示 前 6 个 访问 之 后 的 队列 的 状态 (PF 代表 页 错误 ; HIT 代表 访问 命中 ， 即 没有 页 错误 ): 
访问 #1(PF) 访问 #2(PF) 
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访问 #5(PF) 访问 #6(PF) 





给 定 的 序列 模拟 了 FIFO 的 策略 。 第 6 个 访问 替换 掉 了 页 0， 因 为 它 是 当前 在 内 存 中 驻 留 最 久 的 
页 面 ， 需 要 用 它 腾 出 空间 给 页 5。 然 而 ， 页 0 接 下 来 很 快 会 被 访问 到 (访问 7)。 


通过 观察 前 面 例子 的 内 存 访问 顺序 ， 我 们 可 以 知道 页 0 最 常 被 访问 。 一 个 有 效 的 页 替换 
策略 不 应 该 试图 替换 页 0。 不 幸 的 是 ， 我 们 不 能 提前 知道 哪些 页 面 会 最 常 被 使 用 。 让 我 们 看 
看 有 没有 其 他 方法 比 FIFO 表现 得 好 。 


8.3.4 ”最 近 最 少 使 用 策略 


即使 在 真实 的 生活 中 ,我 们 也 常用 过 去 的 经 验 来 预测 未 来 。 所 以 ， 尽 管 我 们 不 知道 进程 
在 未 来 会 访问 哪些 内 存 ， 但 我 们 可 以 分 析 进 程 之 前 访问 的 内 存 。 我 们 首先 看 看 如 何 将 其 应 用 | 全 
在 页 替换 策略 上 。 最 近 最 少 使 用 策略 (LRU) 假设 页 如 果 在 过 去 很 久 都 没有 被 访问 ， 有 很 大 的 “|329 
概率 它 在 未 来 也 不 会 被 访问 。 所 以 ，LRU 策略 选中 的 被 替换 页 是 最 长 时 间 未 被 使 用 的 页 。 

让 我 们 首先 来 了 解 LRU 策略 的 硬件 支持 。 硬 件 需要 跟 


Be CPU 的 每 次 内 存 访问 。 图 8-9 演示 了 栈 的 数据 结构 。 每 EE 
次 访问 时 CPU 都 会 把 最 常 被 访问 的 页 放 在 栈 项 ;如 果 页 在 ETA 


栈 之 外 的 其 他 地 方 存在 ，CPU 也 会 把 它 移 除 。 所 以 ， 栈 底 Wre Si 
的 页 是 最 不 经 常 被 使 用 的 页 面 ， 而 且 会 被 蔡 换 用 来 处 理 页 | <PID, VPN> | 
错误 。 如 果 我 们 想 跟 踪 所 有 页 帧 的 访问 ， 那 么 栈 的 大 小 应 E 
该 和 实际 物理 页 帧 总 数 一 样 大 。 

接 下 来 ,我 们 来 探讨 LRU 策略 的 数据 结构 。 内 存 管理 
器 应 用 类 似 图 8-9 中 的 硬件 栈 来 选择 栈 底 的 页 作为 被 蔡 换 
页 。 当 然 ， 软 件 从 栈 底 读 取 数据 需要 一 些 指 令 集 上 的 支持 。 
除了 页 表 ， 硬 件 栈 也 可 用 于 虚 页 到 物理 页 的 转换 。 

注意 ， 内 存 管理 器 需要 维护 额外 的 数据 结构 ， 例 如 空闲 列表 和 帧 表 ， 来 处 理 页 错误 。 
我 们 在 这 里 讨论 的 页 访问 顺序 和 FIFO 例子 中 进程 访问 的 页 顺序 是 一 样 的 : 

访问 编号 : 1 2 3 4 5 6 7 8 9 10 1 12 13 

RAS: 9 0 3 4 0 5 0 6 4 5 0 5 4 

假设 有 3 个 物理 页 帧 ， 初 始 时 栈 如 下 所 示 : 





图 8-9 LRU 替换 策略 的 下 推 栈 。 
最 常 使 用 的 页 在 栈 顶 。 最 
不 常 被 使 用 的 页 在 栈 底 





如 下 快照 显示 出 前 6 次 访问 后 栈 的 状态 (PF 代表 页 错误 ; HIT 代表 访问 命中 ,意味 着 没有 页 错误 ): 
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访问 #1(PF 





访问 #3(PF) 
mj 
o 
一 一 
访问 #5(HIT) 
a 
= i 


比较 例 8-4 和 8-5。 在 前 6 次 访问 中 都 经 历 了 5 次 页 缺失 异常 。 不 幸 的 是 ， 我 们 不 能 改善 
这 一 点 ， 因 为 这 些 缺 失 的 页 (9、0、3、4、5 ) 都 不 在 物理 内 存 中 ， 它 们 确实 是 页 缺失 ， 任 何 
策略 都 不 能 避免 这 一 点 。 人 然而， 值得 注意 的 是 LRU 策略 在 第 6 次 访问 时 替换 了 页 面 3 (而 不 
是 FIFO 例子 中 的 页 0 )。 所 以 ， 在 访问 7 的 LRU 策略 会 有 命中 。 换 名 话说 ，LRU 能 够 避免 
在 FIFO 策略 中 遇见 的 异 笛 情 况 - 

近似 LRU 的 实现 #1 : 一 个 简单 的 硬件 栈 LRU 策略 虽然 在 概念 上 很 吸引 人 ， 但 从 具体 
应 用 的 观点 上 来 看 并 不 容易 实现 ， 主 要 原因 有 如 下 几 点 : 

1 ) 因为 物理 帧 数目 很 多 ， 栈 需要 很 多 项 。 如 果 物 理 内 存 是 4GB 并 且 页 大 小 为 8KB， 那 
么 栈 的 大 小 则 有 0.3MB。 在 流水 线 处 理 需 的 数据 通路 中 增加 如 此 大 的 硬件 结构 会 极 大 地 增加 
处 理 器 的 时 钟 周期 。 由 于 这 一 原因 ， 在 处 理 器 的 数据 通路 上 增加 一 个 如 此 大 的 硬件 栈 是 不 实 
际 的 。 

2 ) 为 了 将 当前 的 访问 保存 在 栈 顶 ， 每 次 访问 硬件 都 要 对 栈 进 行 修 改 。 这 种 开销 很 大 的 操 
作 降 低 了 处 理 需 的 速度 。 

因为 这 些 原因 ， 真 正 的 LRU 策略 不 适合 实际 应 用 。 还 有 一 个 更 重要 的 原因 ， 在 某 些 应 用 
中 LRU 会 对 性 能 产生 很 不 利 的 影响 。 人 例如， 假设 一 个 程序 在 顺序 访问 N+1 个 页 之 后 循环 地 
访问 这 些 页 面 。 如 果 内 存 管理 器 为 此 任务 分 配 的 空闲 页 帧 池 大 小 为 N， 这 样 如 果 应 用 LRU R 
略 每 次 访问 都 会 有 页 错误 发 生 。 这 个 例子 表现 出 来 的 病态 性 具有 很 强 的 现实 意义 ， 因 为 科学 
计算 用 的 数组 规模 通常 都 非常 大 。 

可 行 且 对 性 能 影响 较 小 的 办 法 是 采用 近似 的 LRU 方式 。 栈 的 大 小 可 以 设 定 为 一 个 较 小 的 
数字 (例如 16 )， 而 不 是 等 于 物理 内 存 中 实际 帧 的 数目 。 这 样 ， 栈 会 保存 处 理 融 调用 最 近 的 
16 条 历史 访问 记录 (更 久 的 访问 会 从 栈 底 排 出 )。 算 法 会 随机 挑选 一 页 作为 被 蔡 换 页 ， 但 这 不 
是 在 硬件 栈 中 发 生 的 。 典 型 情况 下 ， 算 法 会 保护 最 近 被 访问 的 N 个 页 不 被 蔡 换 ， 而 N 是 便 件 
栈 的 大 小 。 

实际 上 ， 一 些 模拟 运行 情况 研究 发 现 ， 真 正 的 LRU 可 能 比 近似 的 LRU 算法 还 要 糟糕 。 
这 是 因为 除了 Belady 的 Min 算法 外 其 他 的 算法 都 是 对 页 的 访问 进行 猜测 ， 所 以 很 容易 失败 。 
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从 这 个 意义 上 来 说 ， 一 个 不 要 求 任 何 软件 和 硬件 支持 的 单纯 的 随机 替换 算法 ( 见 8.3.2 4) 用 
于 完成 革 些 工作 确实 表现 得 较 好 

近似 LRU 的 实现 #2: 每 个 页 帧 增加 访问 位 ”从 实现 一 个 高 速 的 流水 线 CPU 的 角度 来 看 ， 
追 蹊 每 次 内 存 访问 是 不 现实 的 。 所 以 我 们 要 从 其 他 方法 去 寻找 近似 的 LRU 算法 。 

一 种 可 行 策略 是 从 页 的 层次 去 记录 访问 而 不 是 每 次 单独 访问 。 思 路 是 给 每 个 页 帧 增加 
一 个 访问 位 。 当 CPU 访问 这 一 页 的 任何 位 置 时 硬件 上 都 会 对 这 一 位 进行 设置 ; 而 在 软件 
上 对 它 进 行 读 取 和 和 复位。 硬件 通 过 页 表 协 调 对 物理 内 存 的 访问 。 所 以 ， 我们 在 页 表 中 会 有 
引用 位 。 

让 我 们 将 注意 力 转移 到 选择 被 蔡 换 页 上 。 下 面 是 应 用 访问 位 的 算法 : 

1 ) 内 存 管理 融 为 每 个 页 帧 维护 一 个 名 为 访问 计数 器 的 位 向 量 。 

2) 内 存 管 理 器 定期 谈 取 所 有 页 帧 的 访问 位 ， 并 把 它们 转 储 在 每 个 帧 相应 访问 计数 器 的 最 
高 有 效 位 (msb, most significant bit) 中 。 计 数 需 通过 右 移 将 引用 位 装 人 各 上 自 的 msb 位 置 。 图 
8-10 显示 了 这 一 过 程 。 在 每 次 读 取 访问 位 之 后 ， 内 存 
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管理 器 会 清除 访问 位 。 每 隔 单位 时 间 就 会 重复 该 过 程 。 r ae 
所 以 每 个 计数 器 会 维护 着 最 近 n ARAD olo a e 

a. 页 帧 的 a 页 帧 1 BET Ra 
快照 (图 8-10 里 的 n=32 ) 。 访问 位 | on 
3 ) 访问 计数 器 绝对 值 最 大 的 页 是 最 常 被 访问 的 AEAT 
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X e 页 lala 每 一 页 b> 
问 的 页 ， 也 是 选 作 被 替换 的 页 。 图 8-10 re 每 一 页 的 访 
分 页 守护 进程 是 内 存 管理 器 的 一 项 ， 它 每 隔 一 ee 0.5% 1 


定时 间 间 隔 (由 时 间 段 决定 ) 唤醒 来 执行 前 面 的 算法 步骤 。 
83.5 ”第 二 次 机 会 页 替换 算法 


这 个 算法 对 FIFO 进行 了 扩充 ， 在 FIFO 策略 中 加 入 了 访问 位 的 思想 。 正 如 其 名 ， 这 一 算 
法 会 给 每 个 页 一 次 不 选 为 被 替换 页 的 机 会 。 基 本 的 想法 是 利用 硬件 上 的 访问 位 作为 指示 给 每 
个 页 面 第 二 次 留 在 内 存 中 的 机 会 。 算 法 步骤 如 下 : 

1 ) 初始 时 ， 操 作 系统 会 清空 所 有 页 的 访问 位 。 随 着 程序 的 执行 ， 硬 件 为 程序 的 每 次 页 引 
用 设置 访问 位 。 

2) 如 果 页 面 要 被 替换 ， 内 存 管理 器 以 FIFO 的 方式 选择 被 奉 换 页 。 

3) 如 果 被 蔡 换 页 的 访问 位 被 设置 ， 管 理 需 会 清除 访问 位 ， 并 给 它 一 个 新 的 到 达 时 间 ， 并 
重复 步骤 1。 换 名 话说， 这 个 页 被 移 进 FIFO 队列 的 队 尾 。 

4) 被 替换 页 是 FIFO 队列 中 队 首 访问 位 没有 被 设置 的 页 。 

当然 ， 如 果 所 有 的 页 面 都 进行 了 访问 位 设置 ， 算 法 会 退化 为 简单 的 FIFO 算法 。 

一 个 可 视 化 并 实现 该 算法 的 简单 方式 是 将 页 设想 成 一 个 循环 队列 ， 如 图 8-11a 所 示 ， 
指针 指向 FIFO 候选 者 。 当 要 选 一 个 被 替换 页 时 ， 指 针 会 前 进 直 到 发 现 一 个 访问 位 没有 被 
设置 的 页 。 在 它 向 前 移动 到 最 终 的 被 蔡 换 页 前 ， 内 存 管 理 器 会 清除 它 遇 到 的 页 的 访问 位 。 如 
图 8-11a 所 示 ， 第 一 个 选 作 FIFO 候选 者 的 是 页 7。 然 而 ， 因 为 它 的 访问 位 有 设置 ， 指 针 会 前 
进 直 到 发 现 页 3 并 把 页 3 作为 被 替换 页 ， 因 为 它 的 引用 位 没有 被 设置 (FIFO 队列 中 第 一 个 搜 
索 到 的 未 被 设置 的 页 ) 。 算 法 在 遍历 FIFO 队列 的 过 程 中 会 清除 页 7 和 页 8 的 访问 位 。 注 意 算 
法 在 遍历 的 过 程 中 没有 改变 其 他 未 遇 到 页 的 访问 位 。 可 以 发 现 指 针 扫 描 的 过 程 很 像 时 钟 的 指 
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针 围 绕 圆 圈 在 走 ， 所 以 这 个 算法 也 叫做 时 钟 算法 (clock algorithm). 4M 3 作为 被 替换 页 之 
后 ,指针 会 前 进 直 到 选中 下 一 个 FIFO 候选 者 (图 8-11 (b) 中 的 页 4 )。 


访问 访问 
位 页 # 位 页 # 








FIFO 顺序 FIFO 顺序 


a) 第 二 次 机 会 蔡 换 算法 一 一 内 存 管理 器 在 算法 开始 时 b) 第 二 次 机 会 替换 算法 一 一 算法 会 遍历 访问 位 为 1 的 


保存 指向 FIFO 候选 者 的 指针 。 注 意 有 的 页 帧 的 访 wW (遍历 过 程 中 会 清除 该 位 )， 直 到 发 现 一 个 帧 的 访 
问 位 被 设置 而 有 的 访问 位 被 清空 。 那 些 引 用 位 被 设 问 位 没有 被 设置 ， 并 将 它 作 为 被 替换 页 
置 为 1 的 页 表示 从 上 次 内 存 管理 器 进行 扫描 后 被 程 
序 访问 过 
图 8-11 


假设 我 们 只 有 3 个 物理 帧 ， 并 且 我 们 应 用 第 二 次 机 会 页 替换 算法 。 请 表示 出 按 下 列 页 访问 序列 


执行 程序 帧 中 所 存放 的 虚 页 号 : 
访问 编号 : i 2 4 5 6 7 8 9% H 
虚 页 号 : 0 | 2 3 l 4 5 3 6 4 
=. 


接 下 来 的 图 显示 每 次 访问 处 理 后 页 帧 和 相应 引用 位 的 状态 。 第 一 项 永远 是 FIFO 策略 选中 的 被 替 
换 页 。 注 意 当 页 被 引入 页 帧 时 访问 位 会 进行 设置 。 

为 了 理解 一 个 特定 访问 的 被 替换 页 的 选择 ， 可 看 看 前 一 次 访问 之 后 页 面 的 状态 。 

访问 1 ~ 3: 没有 替换 。 

访问 4: 页 0 选 为 被 替换 页 (因为 所 有 页 的 访问 位 都 有 设置 ， 所 以 FIFO 候选 者 是 被 替换 页 )。 

访问 5: 没有 替换 (页 1 的 访问 位 被 设置 )。 

访问 6: 页 2 是 被 蔡 换 页 (页 1，FIFO 候选 者 ， 因 为 访问 位 还 有 一 次 机 会 )。 

访问 7: 页 1 是 被 替换 页 (页 3，FIFO 候选 者 ， 因 为 访问 位 还 有 一 次 机 会 )。 

访问 8: 没有 替换 (页 3 的 访问 位 被 设置 )。 

访问 9: 页 4 是 被 替换 页 (因为 所 有 页 的 访问 位 都 有 设置 ， 所 以 FIFO 候选 者 是 被 替换 页 )。 
335 访问 10: 页 3 是 被 替换 页 (也 是 FIFO 候选 者 ; 它 的 访问 位 为 空 )。 
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页 由 注解 
访问 1 访问 2 访问 3 访问 4 访问 5 访问 6 
| i fa 
fel 
Ean 


访问 10 














8.3.6 ”页 替换 算法 回顾 


Fe 8-1 对 页 蔡 换算 法 进行 了 总 结 ， 并 说 明了 相应 的 硬件 支持 。 结 果 发 现 使 用 访问 位 的 近 
似 LRU 算法 在 减少 页 错误 率 上 确实 表现 得 很 好 ， 表 现 得 几乎 和 真正 的 LRU 一 样 好 。 这 个 例 
子 很 好 地 说 明了 创造 力 可 帮助 我 们 从 确切 的 解决 方案 中 得 到 最 大 收益 。 
表 8-1 每 种 页 替换 算法 的 比较 


页 替换 算法 需要 的 硬件 支持 需要 保存 的 信息 备注 


Belady 的 MIN _ | Orade 无 基本 上 会 有 最 好 的 性 能 ; 不 靠 硬 件 实 
现 ; 是 性 能 比较 的 上 界 
-i 
FH 
FIFO 每 个 虚拟 页 引入 物理 内 存 的 时 间 | ”可 能 会 有 异常 出 现 ; 通常 比 随 机 替换 
表现 出 的 性 能 还 要 差 


真正 的 LRU 保存 指向 LRU 栈 底 的 指针 预期 性 能 接近 最 优 ; 因为 空间 和 时 间 
复杂 性 无 法 用 硬件 实现 ; 最 坏 情 况 下 甚 
至 低 于 FIFO 


近似 LRU#1 小 的 硬件 栈 保存 指向 LRU 栈 底 的 指针 预期 性 能 接近 最 优 ; 最 坏 情况 下 与 
FIFO 性 能 相似 甚至 低 于 FIFO 


近似 LRU#2 每 个 页 帧 增加 访问 位 | 每 个 页 帧 访问 计数 器 预期 性 能 接近 最 优 ; 减低 硬件 复杂 性 
最 坏 情 况 下 与 FIFO 性 能 相似 甚至 低 于 
FIFO 


第 二 次 机 会 替换 | 每 个 页 帧 增加 访问 位 | 每 个 虚拟 页 引入 物理 内 存 的 时 间 | ”预期 性 能 优 于 FIFO ; 内 存 管 理 和 
LRU 策略 相 比 较为 简单 


8.4 优化 内 存 管理 

在 前 面 的 章节 ， 我 们 展示 了 初级 的 虚拟 内 存 分 页 管理 技术 。 在 本 节 ， 我 们 来 讨论 一 些 提 
高 系统 性 能 的 内 存 管理 器 的 应 用 策略 。 值 得 注意 的 是 ， 优 化 策略 并 不 针对 某 项 特定 的 页 替换 
算法 。 它 们 可 以 应 用 于 前 面 章节 讨论 的 基本 的 页 替换 策略 。 
8.4.1 空闲 页 帧 池 

当 出 现 页 错误 之 后 才 挑 选 被 替换 页 并 不 是 一 个 很 好 的 方法 。 内 存 管理 器 总 是 准备 好 一 定 
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最 少数 量 的 页 帧 随时 用 于 处 理 页 错误 。 分 页 守护 进程 每 隔 一 段 时 间 间 隔 会 被 唤醒 来 查看 空闲 
RAMA (图 8-3) 中 的 空闲 帧 是 否 低 于 最 小 门限 值 。 如 果 低 于 最 小 门限 值 ， 它 会 执行 页 替换 算 
法 来 留 出 更 多 的 空闲 帧 以 满足 最 低 门限 要 求 。 有 时 在 空闲 页 帧 表 中 空闲 帧 的 数目 会 大 于 等 于 
门限 值 。 当 一 个 进程 终止 时 ， 所 有 的 页 帧 都 会 出 现在 空闲 列表 中 ， 用 来 解决 此 问题 。 

处 理 过 程 中 的 |/O ES 在 8.1.4 节 ， 我 们 指出 内 存 管理 将 一 个 页 帧 作为 被 替换 页 前 ， 如 
末 要 处 理 的 是 一 个 脏 页 ， 内 存 管理 豆 要 把 当前 页 面 的 内 容 写 回 磁盘 。 然 而 ， 因 为 内 存 管理 需 
只 是 简单 地 将 页 帧 加 入 空闲 页 帧 表 ， 并 不 会 同时 进行 保存 操作 。 我 们 将 在 后 面 的 章节 看 到 高 
E IO (如 磁盘 ) 和 CPU 活动 同时 执行 。 所 以 ， 内 存 管理 器 要 在 把 帧 加 入 空闲 页 帧 表 之 前 将 脏 
的 被 奉 换 页 进行 IO 写 回 操作 。 由 于 这 个 原因 ， 内 存 管 理 右 也 许 会 跳 过 空闲 页 帧 表 中 的 脏 页 
来 处 理 页 错误 (ILEI 8-12a)。 这 种 策略 有 助 于 减轻 由 页 错误 造成 的 IO 写 等 竺 延 时 问题 。 


a) 空闲 页 帧 表 一 一 出 现 页 错误 时 ， 内 存 管 理 带 可 能 会 选择 页 帧 22 而 不 是 页 帧 52 作为 被 蔡 换 页 A 
为 页 幅 22 是 干净 页 ， 而 页 帆 52 是 脏 页 






















空闲 列表 
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<PID, VPN> <PID, VPN> <PID, VPN> 


b) JA 25 PA OL Wise P AS H HOC AY Az fo] BRT <PID, VPN> 
图 8-12 


页 表 的 反 向 映射 ”为 了 满足 最 低 门 限 要 求 ， 页 面 守护 进程 有 可 能 会 取 走 目前 正在 运行 的 
进程 的 页 帧 。 当 然 ， 这 些 缺 失 页 面 的 进程 有 可 能 因为 页 面 被 抽 走 运行 时 出 现 缺 页 异常 。 事 实 
证 明 ， 我 们 可 以 向 每 个 空闲 列表 的 节点 增加 一 个 额外 的 位 来 缓解 这 一 情况 。 如 果 内 存 管理 需 
没有 把 这 一 物理 页 帧 分 配给 其 他 进程 ， 那 么 我 们 可 以 把 它 从 空闲 页 帧 表 中 取 回 并 分 配给 缺 页 
进程 。 为 了 实现 这 一 优化 ,我 们 在 空闲 页 帧 表 中 每 项 里 增加 了 反 向 映射 (类似 页 帧 表 )， 显 示 
它 最 后 保存 的 虚 页 ( 见 图 8-12b )。 

当 遇 到 页 错误 时 ， 内 存 管理 器 会 把 缺失 进程 的 <PIN，VPN> 和 整个 空闲 页 帧 表 进 行 匹配 。 
如 果 匹 配 成 功 ， 内 存 管 理 器 会 用 找到 的 页 帧 为 发 生 页 错误 的 缺 页 异常 进程 重建 初始 时 页 表 中 
的 映射 。 这 项 优化 策略 排除 了 通过 IO 读 取 从 磁盘 引入 缺失 页 的 需要 。 

这 种 加 强 策 有 意思 的 地 方 是 ， 如 果 在 第 二 次 机 会 替换 算法 之 后 就 应 用 ， 相 当 于 给 了 页 面 
留 在 系统 中 的 第 三 次 机 会 。 
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没有 把 有 用 的 工作 完成 。 例 如 ， 假 设 程序 的 多 道 运行 程度 (在 第 6 章 被 定义 为 同时 在 内 存 中 
运行 并 占用 CPU 计算 资源 的 进程 数目 ) 很 高 ， 但 我 们 仍 观察 到 很 低 的 处 理 器 利用 率 。 我 们 也 
许 会 试图 增加 多 道 运 行程 度 来 让 处 理 器 更 忙 。 表 面 上 看 ， 这 也 许 是 个 好 主意 ， 但 我 们 略 向 深 
层次 挫 据 一下。 


很 有 可 能 目前 所 有 执行 的 程序 都 IO 受 限 (意思 是 说 它们 花费 在 VO 上 的 时 间 比 在 CPU 
上 运行 的 时 间 要 多 )， 在 这 种 情况 下 增加 多 道 运行 程度 也 许 是 个 好 主意 。 然 后 ， 也 有 可 能 程序 
是 CPU 受 限 的 。 乍 一 看 ， 处 理 类 似 的 CPU 受 限 的 工作 时 处 理 器 利用 率 降低 很 奇怪 。 简 单 的 
回答 是 有 太 多 的 分 页 活动 。 我 们 来 前 述 这 一 观点 。 内 存 管 理 器 需要 为 每 个 进程 分 配 足 够 的 空 
间 才 能 完成 相应 工作 。 换 句 话 说， 会 有 更 多 的 页 错误 。 所 以 ， 如 果 内 存 中 同时 存在 太 多 的 进 
程 〈 即 程序 多 道 程度 很 高 )， 那 么 进程 很 有 可 能 会 在 物理 内 存 中 不 停 分 页 。 这 样 ， 所 有 的 进程 
都 没有 前 进 。 在 这 种 情况 下 ， 增 加 程序 的 多 道 程度 并 不 是 个 好 方法 。 实 际 上 ， 我 们 应 该 降低 
多 道 程度 。 图 8-13 显示 了 不 同 多 道 程度 下 CPU 利用 率 的 预期 表现 。 在 某 个 点 之 后 CPU 利用 
率 会 迅速 降低 。 


CPU 利用 率 


多 道 程度 
图 8-13 CPU 颠 敏 现 象 。 当 超过 一 定 多 道 程 度 之 后 CPU 利用 率 会 急剧 下 降 


当 处 理 器 花费 更 多 的 时 间 用 于 分 页 而 不 是 计算 时 就 会 出 现 颠 签 现象 。 分 页 是 操作 系统 中 
进程 的 一 种 隐 式 1/0 行为。 过 多 的 分 页 可 能 会 让 一 个 原本 为 计算 受 限 的 进程 变 成 一 个 IO ZR 
的 进程 。 我 们 从 这 些 讨论 中 得 到 的 一 个 很 重要 的 教训 是 ，CPU 调度 应 该 考虑 进程 的 内 存 利 用 
情况 。CPU 的 调度 策略 只 基于 处 理 器 的 利用 率 是 不 对 的 。 弟 运 的 是 ， 这 种 情况 可 以 通过 调整 
CPU 的 调度 系统 和 操作 系统 的 内 存 管 理 来 进行 纠正 。 

让 我 们 来 讨论 如 何 控制 颠 敏 。 当 然 ， 我 们 可 以 把 整个 程序 装 进 内 存 ， 但 这 并 不 是 一 种 有 
效 利 用 资源 的 方法 。 这 一 方法 在 于 确保 每 个 进程 不 会 有 频繁 的 页 错误 ， 每 个 进程 会 分 配 足 够 
的 页 帧 。 我 们 可 以 应 用 局 部 性 原理 来 帮忙 。 一 个 进程 也 许 会 有 范围 很 广 的 内 存 印记 。 然 而 ， 
如 果 我 们 看 不 同时 间 的 访问 窗口 ， 我 们 会 发 现 进程 的 访问 只 集中 于 整个 内 存 印记 中 的 一 小 部 
分 。 这 就 是 局 部 性 原则 。 当 然 ， 程 序 的 访问 会 随 着 时 间 变 化 ， 如 图 8-14 所 示 。 然 而 ， 这 种 变 
化 也 是 渐进 的 而 不 是 急速 变化 的 。 例 如 ， 在 时 间 tl 程序 访问 的 页 面 为 {pl1，p2} ; 在 时 间 t2 
访问 的 页 面 是 {p2，p3}。 

我 们 不 想 让 读者 认为 程序 访问 的 位 置 总 是 连续 的 页 。 例 如 ， 在 时 间 妇 ， 程 序 访问 的 页 
面 是 {pl1，p4}。 值 得 注意 的 是 ,一 定时 间 间 隔 内 程序 的 访问 活动 被 局 限于 小 部 分 页 面 ( 见 
例 8-7 )。 

应 用 这 项 原则 来 减少 页 错误 也 很 简单 。 如 果 当 前 程序 访问 的 位 点 在 内 存 中 ， 相 关 的 进程 
在 位 点 改变 前 通常 不 会 出 现 页 错误 。 例 如 ， 如 果 程 序 访问 的 页 面 在 时 间 tl 和 也 保持 不 变 ， 并 
上 且 假 设 进程 pl 和 p2 在 物理 内 存 中 ， 那么 在 时 间 tl Al t2 间 程 序 通 常 不 会 经 历 页 错误 。 
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访问 页 








tt t2 t3 t4 t5 t6 t7 t8 


时 间 
图 8-14 程序 访问 位 点 随时 间 的 变化 ; 程序 在 不 同时 间 t 、t2 等 的 访问 页 见 图 ; 假设 程 
序 访 问 的 位 点 在 时 间 间 隔 ， 如 t1 ~ 2 、t ~ 13 等 ， 保 持 不 变 。 


8.4.3 工作 集 


为 了 判定 程序 活动 的 位 点 情况 ， 我 们 定义 并 使 用 工作 集 的 概念 。 工 作 集 (working set) 是 


定义 程序 活动 位 点 的 集合 。 当 然 ， 工 作 集 并 不 是 保持 不 变 的 ， 因 为 程序 活动 的 位 点 会 随时 间 
改变 。 例 如 ， 参 考 图 8-14, 


Working set = {pl, p2} 
Working set,2_,3 = {p2, p3} 
Working setw3_14 = {pl, p2} 
Working set,4.5 = {p3, p4} 
Working sett5 6 = {p2, p3, p4) 


eee eee eee eee ee 


工作 集 的 大 小 (WSS, Working Set Size) 表示 进程 在 一 个 时 间 窗 口 里 访问 的 特定 页 的 数目 。 


例如 ， 在 时 间 间 隔 t ~ t2 中 WSS 是 2， 而 在 时 间 间 隔 4 ~ t6 P WSS È 3. 


系统 内 存 的 压力 是 当前 所 有 会 竞争 资源 的 进程 的 WSS 的 总 和 。 
总 内 存 压 力 =z, WSS i 


在 时 间 间 隔世 ~ t 纪 中 ，3 个 进程 PI、P2 和 P3 的 访问 虚拟 页 次 序 如 下 : 


Pis 1 
P2: 0, 100, 101, 102, 103, 0, 101, 102, 104 
Pe 0, 1, 2. 3, 4, 3,. Os le By. PE 3 
a. 对 于 给 定 的 这 3 个 进程 ， 在 此 时 间 间 隔 内 的 工作 集 是 什么 ? 
b. 在 此 时 间 间 隔 里 系统 的 总 内 存 压 力 是 多 少 ? 
答 : 
P1 的 工作 集 ={0,1,2,10} 
P2 的 工作 集 ={0,100,101,102,103,104} 
P3 的 工作 集 ={0,1,2,3,4,5} 
b. P1 的 工作 集 大 小 WSSp,=4 
P2 的 工作 集 大 小 WSSps=6 
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P3 的 工作 集 大 小 WSS,,=6 

总 内 存 压 力 = 所 有 进程 的 工作 集 数目 之 和 
= 4+6+6 
=16 个 物理 页 帧 


8.4.4 EASES til 
1 ) 如 果 系 统 表 现 出 来 的 总 内 存 压力 比 可 用 内 存 的 总 量 大 ， 内 存 管 理 器 会 降低 程序 的 多 道 


程度 。 如 果 总 内 存 压 力 比 可 用 物理 内 存 的 总 量 小 ， 内 存 管理 器 会 增加 程序 的 多 道 程度 。 341 
s 缺 页 上 限 
iz 
E 
缺 页 下 限 


图 8-15 有 颠 艇 控制 时 的 页 错误 率 。 图 中 阴影 部 分 是 表现 出 的 最 佳 系统 性 能 。 当 页 错误 
率 低 于 缺 页 下 限时 可 以 考虑 增加 程序 的 多 道 运 行程 度 ; 当 页 错误 率 高 于 缺 页 上 
限时 可 以 考虑 降低 多 道 程度 防止 出 现 颠 繁 现 象 


一 种 衡量 进程 WSS 的 近似 方法 是 对 相关 的 物理 帧 使 用 访问 位 。 每 隔 一 定时 间 间 隔 和 A ， 守 
护 进程 会 被 唤醒 并 对 每 个 进程 物理 帧 的 访问 位 进行 采样 。 守 护 进 程 会 记录 相应 访问 位 设置 过 
的 页 号 ; 它 之 后 会 把 这 些 页 的 访问 位 清除 。 这 种 记录 页 号 的 方法 可 让 内 存 管理 帮 获 取 在 任何 
时 间 间 隔 t ~ t+ A 内 的 工作 集 和 给 定 进程 的 WSS。 

2) 另 一 个 控制 颠 敏 的 方法 是 将 观察 到 的 页 错误 率 作 为 衡量 颠 敏 的 指标 。 内 存 管理 器 会 设 
置 两 个 限制 ， 页 错误 的 下 限 和 上 限 CULE 8-15 )。 当 页 错误 率 超 过 缺 页 上 限时 意味 着 有 过 多 的 
分 页 活动 。 在 这 种 情况 下 ， 内 存 管理 器 会 降低 多 道 程度 ， 这 样 可 以 有 效 地 增加 每 个 进程 的 可 
用 物理 帧 数 。 另 一 方面 ， 当 页 错误 率 低 于 页 错误 页 下 限时 意味 着 内 存 管理 需 可 以 增加 程序 的 
多 道 程度 ， 这 样 可 以 有 效 地 减少 每 个 进程 的 可 用 页 帧 数 。 

图 8-15 中 阴影 部 分 显示 出 推荐 的 内 存 管理 器 最 佳 情况 下 所 表现 出 的 性 能 。 当 页 错误 率 比 
缺 页 上 限 高 时 分 页 守护 进程 会 增加 空闲 物理 页 帧 池 ， 当 低 于 缺 页 下 限时 如 果 有 需要 会 增加 程 
序 的 多 道 程度 。 342 


8.5 其 他 考虑 


操作 系统 采用 一 些 其 他 的 措施 来 减少 页 错误 率 。 例 如 ， 当 内 存 管理 器 换 出 一 个 进程 时 
(为 了 减少 程序 的 多 道 程度 )， 它 会 保存 当前 进程 的 工作 集 。 当 内 存 管理 器 换 入 一 个 进程 时 会 把 
相关 的 工作 集 引 入 进来 。 这 种 优化 措施 称 为 预约 式 页 面 调度 ， 在 进程 启动 时 减少 了 中 断 次 数 。 

系统 的 VO 活动 和 CPU 活动 类 似 ， 可 以 同时 进行 。 这 导致 系统 的 内 存 和 IO 子 系统 之 间 
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会 进行 有 趣 的 交互 。 例 如 ,IO 子 系统 可 能 会 进行 初始 化 操作 将 给 定 的 物理 帧 存 人 磁盘 。 同 时 ， 
分 页 守护 进程 也 可 能 会 由 于 页 错误 选择 同样 的 物理 帧 作为 被 蔡 换 页 。 就 像 CPU 调度 器 和 内 存 
管理 融 相 互 配合 工作 一 样 ，IO 和 内 存 子 系统 间 也 会 配合 工作 。 通 常 ， 为 了 防止 内 存 管理 器 将 
要 交换 的 页 面 作 为 被 蔡 换 页 ，LIO 子 系统 会 锁 住 物理 内 存 中 的 页 面 ， 并 保存 一 定时 间 。 页 表 作 
为 IO 于 系统 和 内 存 管理 筑 之 间 的 桥梁 用 来 记录 信息 ， 例 如 需要 锁 住 哪些 物理 内 存 中 的 页 帧 。 
我 们 将 在 第 10 草 中 讨论 VO 的 细节 信息 。 


8.6” 旁 路 转换 缓存 


迄今 为 止 需要 明确 一 点 : 页 错误 对 于 系统 性 能 有 很 坏 的 影响 ， 内 存 管理 器 很 艰难 地 试图 
去 避免 缺 页 。 为 了 各 进程 独立 执行 ， 上 下 文 切 换 时 间 〈 从 一 个 进程 切换 到 另 一 个 ) 大 约 为 几 十 
条 指令 执行 时 间 ; 页 错误 处 理 时 间 (不 算 磁 盘 IO) 也 约 有 几 十 条 指令 执行 时 间 。 换 名 话说， 
Ae GE WEEE VO 上 的 时 间 范 围 是 曝 秒 级 的 ， 对 于 一 个 GHz 级 别 的 处 理 絮 这 相当 于 执行 了 百 万 
行 的 程序 指令 。 

然而 ， 尽 管 我 们 利用 各 种 优化 措施 减少 了 页 错误 的 数目 ， 每 次 内 存 访 问 会 有 两 次 内 存 中 的 
实际 操作 : 一 次 用 于 地 址 转换 ， 另 一 次 用 于 实际 指令 或 数据 的 谈 取 。 这 很 不 理想 。 泣 运 的 是 ， 
运用 一 些 工 程 技巧 ， 我 们 可 以 将 它们 合成 一 个 。 分 页 的 概念 消除 了 用 户 对 程序 使 用 连续 内 存 的 
想法 。 然 而 ， 实 际 情况 是 ， 一 个 页 面 中 的 内 容 在 内 存 里 是 连续 存放 的 。 所 以 ， 如 果 我 们 对 一 
个 页 面 做 地 址 转换 ， 那 么 这 个 地 址 转换 适用 于 页 面 中 所 有 的 内 容 。 这 表明 可 以 向 CPU 中 增加 
一 些 硬 件 来 记录 地 址 转换 信息 。 然 而 ， 我 们 知道 程序 总 是 有 范围 很 广 的 内 存 印迹 。 而 我 们 之 
前 提 到 过 的 局 部 性 原理 现在 又 发 挥 作用 了 。 如 图 8-14 所 示 ， 我 们 对 于 一 个 特定 程序 一 次 只 需 
记 住 一 部 分 翻译 信息 ， 忽 略 它 的 整个 内 存 印 记 。 这 就 是 穷 路 转换 缓存 (TLB, Translation Look- 
aside Buffer) 的 答题 思路 ， 设 计 一 个 小 的 CPU 可 以 保存 了 最近 翻译 信息 的 硬件 ( 见 图 8-16 )。 每 个 
页 面 的 地 址 转换 至 少 要 做 一 次 。 所 以 ， 当 处 理 需 局 动 时 表 中 所 有 的 项 都 是 无 效 的 。 这 就 是 每 个 
项 中 设置 有 效 位 的 原因 。PFN 字段 提供 那 一 项 VPN 对 应 的 物理 页 帧 号 。 
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图 8-16 ZIKE (TLB) 保存 最 近 处 理 器 用 到 的 地 址 转换 


请 注意 TLB 是 如 何 划 分 为 两 部 分 的 。 一 部 分 用 于 保存 和 用 户 地 址 空间 相关 的 翻译 ， 为 一 
部 分 应 用 于 内 核 空 间 。 对 于 上 下 文 切换 ， 操 作 系 统 简 单 地 使 所 有 的 用 户 空间 翻译 无 效 ， 调 度 
新 的 进程 ， 并 建立 那 一 部 分 的 表 。 内 核 空间 转换 独立 于 处 理 屁 正在 运行 的 用 户 进 程 ， 是 有 效 
的 。 为 了 更 好 地 进行 TLB 管理 ， 指 令 集 提供 专门 的 TLB (purge TLB), 一 种 可 在 内 核 模 式 中 
执行 的 特权 指令 。 


8.6.1 TLB 的 地 址 转换 


图 8-17a 和 图 8-17b 显示 了 TLB 中 的 CPU 地 址 转换 。 硬 件 会 首先 检查 对 于 CPU 产生 的 
地 址 转换 在 TLB 中 是 否 有 效 。 我 们 将 TLB 中 一 次 成 功 的 查询 称 为 命中 。 如 果 没 有 命中 则 称 
为 缺失 。 如 果 命 中 ，TLB 中 的 PFN 会 帮助 产生 物理 地 址 ， 这 样 避免 了 去 内 存 中 做 地 址 转换 。 
如 果 缺 失 ， 内 存 中 的 页 表 会 提供 PFN， 便 件 会 把 翻译 的 结果 保存 在 TLB 中 为 将 来 访问 相同 的 
页 做 准备 。 





图 8-17 a) 地 址 转换 (TLB 命中 )。TLB 中 保存 当前 VPN 到 PFN 的 上 映射， 避免 了 从 页 
表 中 查询 的 需要 





图 8-17 b) 地 址 转换 (TLB RA). VPN 回 PFN 的 映射 目前 不 在 TLB 表 中 ， 需 要 在 页 
表 中 进行 查询 


当然 ,很 有 可 能 地 址 转换 并 不 是 完全 由 软件 实现 的 。 你 也 许 会 好 奇 这 怎么 可 能 。 通 常 当 
没有 在 TLB 块 中 发 现 需要 的 翻译 时 硬件 会 发 出 TLB 缺失 异常 。 如 果 这 一 页 没有 出 现在 内 存 
中 则 会 升级 为 真正 的 TLB 错误 。 任 何 情况 下 ,一 旦 完成 了 TLB 缺失 页 的 处 理 ， 操 作 系统 就 
会 把 地 址 转换 信息 保存 在 TLB 中 ,便于 以 后 操作 。 例 如 MIPS 和 DEC Alpha 等 体系 结构 处 理 
这 样 的 TLB 缺失 是 完全 在 软件 层面 实现 的 。 通 常 ， 这 些 体 系 结构 的 ISA 对 于 修改 TLB 项 都 
有 特殊 的 指令 集 。 我 们 习惯 将 它们 称 为 软件 管理 的 TLB. 

TLB 是 一 种 特殊 的 内 存 ， 和 我 们 以 前 遇 到 的 任何 人 硬件 都 不 同 。TLB 是 一 个 保存 VPN 和 
PEN 映射 的 散 列表 。 对 给 定 的 VPN， 硬件 需要 对 整个 表 进 行 查 找 进 行 匹配 。 我 们 将 这 种 人 硬件 
设施 作为 内 容 可 寻 址 存储 器 (CAM, Content Addressable Memory) 或 关联 存储 器 (Associative 
Memory)» TLB 的 硬件 实现 细节 取决 于 它 的 组 织 结构 ， 
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TLB 是 缓存 (caching) 的 一 种 特殊 的 表现 形式 ， 关 于 缓存 ， 我 们 将 在 第 9 章 多 级 存储 体 
系 中 进行 详细 表述 。TLB 满足 缓存 的 定义 ， 即 任何 子 系统 用 一 个 小 表 将 最 近 用 到 的 表 项 保存 
起 来 。 从 这 一 点 来 说 ， 这 一 概念 更 像 在 第 2 章 中 介绍 的 类 似 工具 箱 或 工具 托盘 的 概念 。 下 面 
举 一 些 具体 的 例子 : 

a. 处 理 器 高 速 缓存 ( processor cache) 指 在 处 理 需 设计 中 为 了 保存 最 近 访 问 的 内 存 地 址 而 
设计 的 硬件 设备 。 

b. 在 处 理 硕 设计 中 将 最 近 使 用 的 地 址 转换 保存 在 TLB 中 。 

c. 在 磁盘 控制 硕 设 计 中 将 最 近 访 问 的 磁盘 块 放 进 内 存 里 ( 见 第 10 章 )。 

d. 在 文件 系统 设计 中 ， 将 最 近 访 问 的 文件 在 磁盘 上 的 物理 位 置信 息 保 存在 内 存 的 数据 结 
FKP CULES 11 章 )。 

e. 在 文件 系统 设计 中 用 内 存 中 的 软件 缓存 保存 最 近 磁 盘 访 问 过 的 文件 ( 见 第 11 章 )。 

f. 在 Web 浏览 右 设 计 中 将 最 近 访 问 的 网 页 保留 在 本 地 。 

换 名 话说， 缓存 是 临时 保存 项 目的 一 小 部 分 而 不 是 永久 性 地 保留 全 部 信息 的 一 种 笼统 的 
概念 。 我 们 将 在 第 9 章 讨论 更 多 关于 处 理 需 缓存 实现 的 信息 ， 也 会 谈 到 多 级 存储 体系 。 


8.7 ”内 存 管理 的 高 级 话题 

我 们 提 到 过 ， 内 存 管 理 需 的 数据 结构 包括 进程 的 页 表 。 让 我 们 来 算 一 上 下， 假设 每 个 页 面 
有 40 位 的 字 节 可 寻 址 虚拟 地 址 和 SKB 大 小 的 页 面 ， 对 于 每 个 进程 的 页 表 我 们 需要 2” 个 页 面 
项 。 这 对 每 个 进程 形成 了 一 个 高 达 128 兆 的 页 表 项 。 机 器 整个 物理 内 存 的 大 小 也 许 不 如 一 个 
进程 的 页 表 大 。 

我 们 将 展示 一 些 初步 的 解决 物理 内 存 中 管理 页 表 大 小 的 思想 。 操 作 系 统 中 一 个 更 高 级 的 
课程 将 对 这 一 话题 进行 更 深入 的 讨论 。 


8.7.1 多 级 页 表 


基本 思想 是 将 一 个 单 级 页 表 划 分 为 多 级 页 表 。 为 了 进行 更 具体 的 讨论 ， 可 以 想象 一 个 有 
32 位 虚拟 地 址 、4KB 大 小 的 页 面 。 页 表 有 2” 项 。 让 我 们 考虑 一 个 2 级 的 页 表 ， 如 图 8-18 所 
示 。 虚 拟 地 址 的 VPN 有 两 部 分 。VPN1 会 选择 第 一 级 页 表 2 ”个 页 表 项 中 的 一 项 。 还 会 有 一 
个 第 二 级 页 表 (用 VPN2 来 索引 ) 来 展开 第 一 级 页 表 中 特定 的 项 。 这 样 就 有 2 ”(1024 ) 个 二 
级 页 表 ， 每 个 二 级 页 表 有 2" 个 项 。 二 级 页 表 中 存 有 对 应 虚拟 地 址 VPN 的 PFN. 

这 种 页 表 需 要 多 大 的 空间 ? 如 果 是 单 级 页 表 ， 我 们 需要 2” 项 (1M 项)。 如 果 是 2 级 页 
表 ， 我 们 需要 2" 个 一 级 页 表 项 和 2" 个 二 级 页 表 ， 每 个 二 级 页 表 有 2" 个 项 。 那 么 二 级 页 表 
的 空间 大 小 是 1K 项 (一 级 页 表 的 大 小 )， 总 空间 大 小 超过 了 单 级 页 表 的 结构 。9 

我 们 从 这 种 二 级 结构 中 得 到 了 什么 ?这 种 结构 使 得 对 需要 一 直 保 存在 物理 内 存 中 的 内 核 
数据 结构 的 需求 急剧 减少 。 让 我 们 来 看 看 为 什么 。 每 个 进程 的 一 级 页 表 有 IK 个 项 。 这 对 于 
物理 内 存 中 每 个 进程 的 数据 结构 大 小 来 说 很 合理 。 第 二 级 页 表 没 有 必要 装 入 物理 内 存 。 内 存 
管理 器 将 它们 保存 在 虚拟 内 存 中 ， 并 且 在 程序 局 部 性 原理 的 基础 上 对 二 级 页 表 进 行 分 页 。 

现代 操作 系统 提供 适合 64 位 处 理 器 体系 结构 的 多 级 页 表 (〈 即 多 于 2 级 )。 不 全 的 是 ， 如 
果 有 更 多 级 的 页 表 ， 也 就 意味 着 对 物理 内 存 会 有 更 多 次 的 潜在 访问 。 尽 管 有 这 样 的 事实 ， 幸 


© 注意 一 级 页 表 的 页 表 项 的 大 小 和 单 级 页 表 结构 的 不 一 样 。 然 而 为 了 使 讨论 简单 ， 我 们 不 考虑 这 些 细节 。 
为 了 更 好 地 阐述 这 一 点 请 参考 练习 11. 
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运 的 是 ，TLB 使 接 下 来 对 相同 页 面 的 内 存 访问 的 翻译 不 耗费 资源 。 


~ 








图 8-18 ”二 级 页 表 。VPN 的 最 高 位 (VPN1 ) 用 于 对 一 级 页 表 进 行 检索 ， 从 而 获取 二 级 页 
表 的 内 存 地 址 。 每 个 二 级 页 表 保 存 VPN 最 后 几 位 (VPN2 ) 指定 的 虚 页 的 映射 


考虑 64 位 虚拟 地 址 空间 ，8KB 页 面 大 小 的 内 存 系统 ， 我 们 使 用 五 级 页 表 。 每 个 进程 第 一 级 页 
RAR 2K (2048) 个 页 表 项 ， 剩 下 的 4 个 级 别 的 页 表 都 会 保存 IK (1024) SHRM, 
a. 给 出 系统 中 与 这 一 多 级 页 表 结 构 相 应 的 虚拟 地 址 的 布局 。 
b. 每 个 进程 需要 的 总 页 表 空 间 是 多 少 〈 即 所 有 级 别 页 表 的 总 和 ) ? 347 
=. 
a. 对 于 8KB 的 页 面 大 小 ， 每 页 的 偏 移 地 址 位 数 是 13。 
那么 VPN 的 位 数 =64 一 13=51 位 
用 于 第 一 级 页 表 的 位 数 ( 2048 个 项 ) = 11。 
剩 下 4 级 页 表 每 个 需要 的 位 数 (每 个 页 表 有 1024 项 ) = 10。 
虚拟 地 址 布局 如 下 : 


13 12 0 位 地 址 信息 


13 位 的 数目 
b. 第 一 级 页 表 中 项 的 数目 = 2 。 
第 二 级 页 表 中 项 的 数目 =2"。 
和 图 8-18 类 似 ， 有 2" 个 二 级 页 表 (每 个 和 一 级 页 表 项 对 应 )。 所 以 总 的 二 级 页 表 项 的 数目 
是 2 

三 级 页 表 中 项 的 数目 =2 。 
共有 221 个 这 样 的 三 级 页 表 (每 个 对 应 二 级 页 表 中 的 一 项 )。 所 以 三 级 页 表 项 的 数目 =2 。 

四 级 页 表 中 项 的 数目 =2 。 

BHAA 个 这 样 的 四 级 页 表 (每 个 对 应 三 级 页 表 中 的 一 项 )。 所 以 ， 四 级 页 表 项 的 数目 =2 。 
五 级 页 表 中 项 的 数目 =2” 。 

总 共 会 有 24 个 这 样 的 五 级 页 表 (每 个 对 应 四 级 页 表 中 的 一 项 )。 所 以 ， 五 级 页 表 项 的 数目 =2 。 
pte tar ete Doty 
对 于 这 样 的 虚拟 内 存 系统 如 果 采 用 单 级 页 表 的 形式 那么 每 个 页 表 要 求 有 2” 项 。 
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8.7.2 局 部 页 表 项 的 访问 权限 


TATU H LT HA AEB PFN 和 有 效 位 之 外 还 有 其 他 信息 。 例 如 ， 它 会 包含 特定 页 的 访 
问 权 限 ， 如 只 读 、 读 写 ， 等 等。 和 第 7 草 内 存 管 理 需 的 功能 ( 见 7.1 节 ) 阐述 的 观点 一 致 ， 这 
所 很 重要 。 特 别 注意 内 存 管理 紫 要 提供 内 存 保护 和 进程 间 的 独立 性 。 更 进一步 ， 进 程 还 要 保 
护 目 己 不 受 程序 错误 的 影 啊 (例如 ， 程 序 无 意 中 对 整个 内 存 印 记 的 访问 )。 最 后 ， 进 程 间 当 有 
需要 时 应 能 够 共享 内 存 空间 。 页 表 项 的 访问 权限 信息 是 硬件 和 软件 交互 协作 的 另 一 种 方式 。 
在 进程 创建 时 ， 内 存 管 理 硕 会 在 页 表 中 为 程序 内 存 印 记 中 的 页 设置 访问 权限 。 例 如 ， 对 于 包 
售 代 码 的 页 会 设置 为 只 谈 ， 对 于 数据 的 页 会 设 为 读 写 。 人 硬件 在 地 址 转换 时 会 对 每 次 内 存 访问 
的 权限 进行 检查 。 当 检测 出 越权 访问 时 ， 人 硬件 会 进行 纠 错 。 例 如 ， 如 果 一 个 进程 试图 去 写 一 
个 只 谈 页 ， 会 导致 访问 违例 陷入 ， 并 将 控制 交 由 操作 系统 来 采取 措施 。 

页 表 项 也 是 操作 系统 为 每 个 页 存放 其 他 相关 信息 的 地 方 。 例 如 ， 页 表 项 可 以 包含 发 生 页 
错误 时 情况 下 从 磁盘 引入 页 面 的 信息 。 


8.7.3 RANK 


因为 虚拟 内 存 通常 比 物理 内 存 大 很 多 ， 一 些 体 系 结构 (例如 IBM 的 Power Ab) 会 用 
反 向 页 表 ， 这 实际 上 就 是 页 帧 表 。 反 向 页 表 减 轻 了 对 每 个 进程 页 表 的 需要 。 更 深 一 步 ， 反 向 
表 的 大 小 和 物理 内 存 的 大 小 ( 帧 数 上 ) 相等 ， 而 不 是 虚拟 内 存 。 不 幸 的 是 ， 反 向 页 表 使 硬件 关 
于 逻辑 地 址 向 物理 地 址 的 翻译 变 得 复杂 。 所 以 ， 在 这 样 的 处 理 器 中 ， 硬 件 通过 TLB 机 制 进行 
地 址 转换 。 当 遇 到 TLB 缺失 时 ， 硬 件 会 把 控制 (通过 陷入 ) 转交 给 操作 系统 来 解决 软件 上 地 
址 转换 的 问题 。 操 作 系 统 也 会 负责 更 新 TLB 表 。 体 系 结构 通常 会 提供 特殊 的 指令 集 用 于 特权 
模式 下 的 读 、 写 和 清除 TLB 中 的 项 。 


小 结 


现代 操作 系统 的 内 存 子 系统 包括 分 页 守护 进程 、 替 换 管 理 器 、 页 错误 处 理 程序 等 。 子 系 
统 与 CPU 调度 器 和 IO 子 系统 进行 密切 协调 。 下 面 是 我 们 对 本 章 进 行 的 快速 小 结 : 

© 按 需 分 页 基础 ， 包 括 人 硬件 支持 和 操作 系统 用 于 分 页 的 数据 结构 ; 

。 处理 页 错误 时 CPU 调度 器 和 内 存 管理 需 之 间 的 交互 ; 

。 页 替换 策略 ， 包 括 FIFO, LRU 和 第 二 次 机 会 替换 策略 ; 

。 用 于 减少 页 错误 损失 的 技巧 ， 包 括 保存 一 个 页 帧 池 可 以 随时 为 页 错误 处 理 分 配 帧 ， 尽 

可 能 延迟 将 必要 的 替换 页 写 回 磁盘 以 及 替换 帧 到 被 替换 页 的 反 向 映射 ; 

© Ai AVE Be A TF il BS TER ; 

。 为 了 保持 流水 线 处 理 器 持续 工作 用 于 加 速 地 址 转换 的 劳 路 转换 缓存 ; 

© 有 关内 存 管 理 器 更 深入 的 探讨 ， 包 括 多 级 页 表 和 反 向 页 表 。 

我 们 在 第 7 章 中 观察 到 ， 现 代 处 理 器 支持 基于 页 的 虚拟 内 存 。 相 应 地 ， 用 于 现代 处 理 需 的 操 
作 系 统 如 Linux 和 Microsoft Windows (NT, XP 和 Vista) 都 实现 了 基于 页 的 内 存 管理 。8.3.5 Wi 
论 的 第 二 次 机 会 页 替换 策略 是 一 种 很 流行 的 策略 ， 和 其 他 策略 相 比 它 具 有 简便 性 和 相对 高 效 性 。 


练习 题 
1. 对 于 有 5 个 阶段 的 流水 线 处 理 器 ， 当 发 生 页 错误 时 ， 为 了 指令 重启 硬件 上 需要 做 哪些 工作 ? 


2. 描述 分 页 内 存 管理 需 中 页 帧 表 和 磁盘 映射 数据 结构 所 扮演 的 角色 。 
3. 模拟 页 错误 处 理 的 步 又 。 
4. 描述 进程 调度 器 和 内 存 管理 器 之 间 的 交互 。 
5. 第 二 次 机 会 页 替换 算法 和 简单 的 FIFO 算法 有 什么 区 别 ? 
6. 考虑 一 种 体系 结构 ， 对 于 TLB 中 的 每 项 都 有 
1 个 访问 位 (“4 CPU 访问 相关 TLB 中 的 项 进行 地 址 转换 时 硬件 会 自动 进行 设置 )。 
1 个 脏 位 C CPU 访问 相关 TLB 中 的 项 进行 存储 访问 时 人 硬件 会 自动 进行 设置 )。 
这 些 位 和 8.6 节 讨 论 的 关于 TLB 其 他 方面 的 字段 一 样 。 该 体系 结构 提供 了 3 条 特殊 指令 
。 一 个 用 于 对 特定 TLB 项 的 访问 位 进行 采样 (Sample TLB(entry_num); 
“一 个 用 于 对 特定 TLB 项 的 访问 位 进行 清除 (Clear_refbit_TLB(entry_num) ); 
。 一 个 用 于 对 所 有 TLB 项 的 访问 位 进行 清除 (Clear all refbits TLB(ALL)). 350 
使 用 TLB 的 额外 帮助 提出 页 替换 的 实现 策略 。 给 出 用 于 维护 并 实现 页 替换 策略 的 算法 的 数据 结 
构 和 伪 代 码 。 
7. 进程 有 如 下 的 内 存 访问 序列 : 
1312348318234 
给 定 的 序列 〈 表 示 进 程 的 虚 页 号 ) 在 进程 执行 中 重复 进行 。 假 设 有 3 个 物理 页 帧 。 
给 出 真正 的 LRU 页 替换 策略 的 分 页 活动 。 给 出 LRU 栈 和 前 12 次 访问 所 替换 的 页 。 给 出 哪些 访 
问 会 命中 ， 哪 些 访问 会 出 现 页 错误 。 
8. 进程 有 如 下 的 内 存 访问 序列 : 
43123234141234 
给 定 的 序列 (表示 进程 的 虚 页 号 ) 在 进程 执行 中 重复 进行 。 最 佳 页 替换 策略 前 12 次 访问 的 分 页 
活动 应 该 是 怎样 的 ? 给 出 哪些 访问 会 命中 ， 哪 些 访 问 会 出 现 页 错误 。 
9. 处 理 器 要 得 到 虚拟 内 存 地 址 0x30020 的 内 容 。 使 用 到 的 分 页 策略 将 它 分 解 为 VPN=0x30 FiF Heh 
0x020. 
PTB (一 个 用 于 保存 页 表 地 址 的 CPU 寄存 器 ) 的 值 为 0x100。 表 明 这 个 进程 的 页 表 从 地 址 0x100 
开始 。 
机 器 采用 按 字 寻 址 ， 页 表 的 每 项 为 单字 长 : 


PTBR=0x100 
VPN Offset 
0x30 0x020 


选中 的 地 址 对 应 内 存 中 的 内 容 如 下 : 
物理 地 址 内 容 


0x00000 0x00000 
0x00100 0x00010 
0x00110 0x00000 
0x00120 0x00045 
0x00130 0x00022 
0x10000 0x03333 351 
0x10020 0x04444 
0x22000 Ox01111 
0x22020 002222 
0x45000 0x05555 
0x45020 0x06666 


352 
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地 址 是 如 何 计算 的 ? 
当地 址 返回 处 理 器 时 的 内 容 是 什么 ? 
最 坏 情况 下 会 有 多 少 内 存 访问 ? 
10. 在 时 间 间 隔 tl ~ t2 中 ，3 个 进程 P1、P2 和 P3 分 别 记录 了 如 下 的 虚 页 访问 : 
Pis Ù; 0 i; 2 is 2 iz iÒ 
P2: 0, 100, 101, 102, 103, 0, 1, 2, 3 
PSs GC, 1, 2) 3 O. 1, B 3, a 5 
给 定 的 3 个 进程 在 此 时 间 间 隔 内 的 工作 集 分 别 是 什么 ? 
此 时 间 间 隔 中 系统 的 总 内 存 压 力 是 多 少 ? 
11. 对 于 一 个 有 20 位 页 帧 数 的 虚拟 内 存 系统 ， 给 出 对 于 一 级 页 表 和 二 级 页 表 分 配 策略 的 实际 不 同 。 对 于 
二 级 页 表 ， 假 设 布局 和 图 8-18 类 似 。 我 们 只 对 常 驻 内 存 中 的 页 表 感 兴趣 。 对 于 一 个 二 级 页 表 ， 存 放 
在 内 存 中 的 是 第 一 级 页 表 。 对 于 单 级 页 表 ， 整 个 页 表 都 需要 存储 在 内 存 中 。 你 需要 算出 不 同 组 织 结 
构 ( 单 级 或 二 级 ) 的 PTE 细节 来 计算 每 种 组 织 结构 总 的 页 表 需 求 。 


参考 文献 注释 和 扩展 阅读 


Peter Denning 开创 了 工作 集 模 型 及 其 对 性 能 影响 的 研究 工作 [Denning, 1968], FIFO 替换 算法 的 
缺点 首先 由 Belady 等 发 表 于 [Belady, 1969]。 用 Belady 的 名 字 命名 的 最 优 页 替换 算法 “Belady 最 小 ” 
算法 最 早 发 表 于 [Belady, 1966]。Carr 和 Hennessy[Carr, 1981] 提出 了 WSCLOCK， 是 本 章 讨论 的 基本 
时 钟 算法 的 增强 版 ， 其 中 利用 了 工作 集 的 概念 。Siberschatz 等 在 教科 书 [Silberschatz, 2008] 中 对 页 替 
换算 法 进行 清晰 的 介绍 。Bryant 和 O’Hallaron 在 其 教科 书 中 从 程序 员 的 角度 对 虚拟 内 存 进行 了 很 好 的 
讲解 [Bryant, 2003]。 
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分 级 存储 体系 





我 们 首先 来 了 解 什么 是 分 级 存储 体系 。 目 前 为 止 , 我 们 一 直 把 物理 内 存 当 作 黑 盒 对 待 。 
在 对 LC-2200 (第 3 HAR 5 章 ) 进行 讨论 时 ， 我们 把 内 存 看 作 数 据 通 路 的 一 部 分 。 这 种 安排 
有 一 个 隐 含 假设 ， 即 访问 内 存 花 费 的 时 间 和 其 他 数据 通路 操作 所 花费 的 时 间 一 样 多 。 我 们 稍 
微 深 入 讨论 这 一 假设 。 当 今 ， 处 理 带 时 钟 速率 达到 了 GHz 的 程度 。 这 意味 着 CPU 时 钟 周期 
小 于 1ns。 我 们 把 它 和 当前 速度 最 快 的 内 存 进行 比较 ( circa 2009 )。 应 用 动态 随机 访问 存储 器 
(Dynamic Random Access Memory, DRAM) 技术 的 物理 内 存 的 时 钟 周 期 的 数量 级 是 100ns。 
我 们 知道 在 流水 线 处 理 需 应 用 中 最 慢 的 部 分 决定 处 理 需 的 时 钟 周期 。 在 给 定 流 水 线 内 存 访问 
HJ IF 和 MEM 阶段 ， 我 们 要 想 办 法 衔接 CPU 和 内 存 之 间 存 在 的 100:1 速度 上 的 差距 。 

在 内 存 系统 中 定义 两 个 有 关 频 率 的 术语 访问 时 间 (access time) 和 时 钟 周 期 ( cycle 
time ) 一 一 是 很 有 用 的 。 访 问 时 间 的 意思 是 从 回 内 存 提交 一 个 请 求 到 获取 数据 之 间 的 时 间 延 迟 。 
回 内 存 系统 提交 的 两 次 连续 的 请 求 之 间 的 时 间 差 称 为 时 钟 周期 。 有 许多 因素 会 对 访问 时 间 和 
时 钟 周期 造成 影响 。 例 如 ，DRAM 技术 用 单 品 体 管 存储 1 位 。 读 取 该 位 会 耗 尽 存储 的 电量 ， 
所 以 在 下 次 读 取 该 位 前 要 进行 补充 操作 。 这 就 是 在 DRAM 中 时 钟 周 期 和 读 取 访问 时 间 之 间 有 
差距 的 原因 。 除 了 实现 内 存 系 统 所 用 的 特定 技术 外 ,在 连接 内 存 系统 和 处 理 句 之 间 的 总 线 上 
的 传输 延迟 也 增加 了 访问 时 间 和 时 钟 周 期 之 间 的 差距 。 

让 我 们 重新 来 看 看 LC-2200 的 处 理 器 数据 通路 。 它 包含 一 个 寄存 器 堆 ， 寄 存 器 堆 也 是 一 
种 存储 器 。 一 个 小 的 16 元 素 寄存 髓 堆 的 访问 时 间 与 访问 其 他 数据 通路 元 素 的 速度 相当 。 有 两 
个 原因 会 造成 这 种 情况 。 第 一 个 原因 是 寄存 器 堆 使 用 了 不 同 的 技术 ， 即 静态 随机 访问 存储 器 
( Static Random Access Memory, SRAM) 技术 。 这 项 技术 的 优点 在 于 速度 快 。SRAM 在 速度 
Eft DRAM 的 原因 在 于 它 使 用 了 6 个 晶体 管 存储 每 一 位 ， 这 样 就 不 需要 读 后 进行 充电 。 基 
于 同样 的 原因 ，SRAM 的 访问 时 间 和 时 钟 周期 没有 差别 。 作 为 一 条 经 验 法 则 ，SRAM 的 时 钟 
周期 是 DRAM 的 8 ~ 16 倍 。 正 如 你 所 猜测 的 ， 因 为 SRAM 每 位 有 6 个 晶体 管 (而 DRAM 每 
位 有 1 个 晶体 管 )， 所 以 SRAM 通常 比 DRAM 的 体积 大 ， 同 样 的 原因 ，SRAM 也 会 耗费 更 多 
的 电量 。 毫 无 疑问 SRAM 每 位 相对 于 DRAM 也 会 贵 一 些 〈 大 约 是 8 ~ 16 倍 )。 

物理 内 存 比 寄存 器 堆 慢 的 第 二 个 且 更 具 说 服 力 的 原因 是 巨大 的 尺寸 。 每 个 寄存 器 堆 的 容 
量 通常 是 16、32 或 64 元 素 项 。 另 一 方面 ， 度 量 内 存 容量 通常 用 KB、MB 或 GB。 换 名 话说 ， 
即使 我 们 在 物理 内 存 中 使 用 了 SRAM 技术 ， 但 与 寄存 器 堆 相 比 ， 更 大 的 结构 也 会 导致 更 慢 的 





”访问 时 间 。 不 考虑 使 用 的 技术 ( 即 SRAM 或 DRAM)， 简 单 的 现实 是 你 可 以 拥有 很 快 的 速度 


或 很 大 的 容量 ， 但 不 能 两 者 均 占 。 鱼 和 能 掌 不 能 兼 得 。 

从 现实 角度 考虑 ，SRAM 不 能 用 来 实现 大 型 内 存 系统 ， 原 因 有 很 多 ， 包 括 电 量 损耗 、 心 
片 尺寸 、 大 规模 SRAM 不 可 避免 的 时 间 延 迟 ， 最 重要 的 原因 是 用 这 项 技术 实现 大 内 存 的 花 
费 。 另 一 方面 ， 与 SRAM 相 比 ，DRAM 技术 能 量 消耗 小 且 能 有 大 规模 的 集成 度 。 例 如 ， 引 用 
2007 年 的 数据 ， 单 个 DRAM 芯片 可 以 有 256Mb， 访 问 时 间 为 70ns。DRAM 技术 的 优点 是 尺 
寸 。 因 此 ,使 用 DRAM 技术 实现 大 规模 内 存 系 统 是 经 济 且 合理 的 选择 。 
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91 缓存 的 概念 


有 少量 的 快速 存储 器 和 大 量 的 慢 速 存储 器 是 合理 的 。 理 想 情况 下 ， 我 们 想 要 拥有 大 容量 
慢 速 存 储 器 在 尺寸 上 的 优点 和 小 容量 快速 存储 器 在 速度 上 的 优点 。 在 前 面 讨 论 的 关于 速度 和 
尺寸 的 前 提 下 ,我 们 选择 用 SRAM 技术 实现 小 容量 快速 存储 器 ， 用 DRAM 技术 实现 大 容量 
慢 速 存储 器 。 

分 级 存储 体系 同时 实现 了 这 两 个 目标 。 图 9-1 
说 明了 分 级 存储 体系 的 基本 思想 。 主 存 是 计算 机 指 
今 集 显 式 的 物理 存储 器 。 缕 存 ， 正如 其 名 ， 是 隐 式 pekee 
存储 器 。 在 第 8 章 ( 见 8.6 节 ) 讨论 将 TLB 作为 存 
储 地 址 转换 信息 的 特殊 情况 时 ， 我 们 就 已 经 引入 了 
缓存 的 概念 和 它 在 计算 机 系统 不 同方 面 的 应 用 。 特 
别 地 ， 在 处 理 器 进行 内 存 访问 的 上 下 文中 ， 该 思想 
是 指 将 从 内 存 中 取出 的 信息 保存 在 缓存 中 。 缓 存 比 
主 存 小 ， 因 此 ， 也 更 快 。 Epi , 

我 们 的 目标 是 ，CPU 从 缓存 中 查找 它 在 主 存 中 ”图 9-1 一 个 基本 的 分 级 存储 体系 。 图 中 显 





离 处 理 需 越 
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示 一 个 二 eA } 
需要 的 数据 。 如 果 数据 不 存在 ， 它 再 从 主 存 中 检索 它 ee reg re 
们 。 如 果 缓 存 能 够 满足 大 部 分 的 CPU 请 求 ， 那 么 我 eee 系 ( 在 主 
们 就 能 够 获得 较 好 的 缓存 提速 效果 。 徊 有 3 RE 


9.2 局 部 性 原理 


我 们 来 了 解 为 什么 缓存 首先 工作 。 答 案 是 我 们 在 前 面 章节 中 讨论 过 的 局 部 性 原理 ( 见 
8.4.2 4). 

大 致 来 讲 ， 程 序 倾 问 于 访问 内 存 中 相对 较 小 的 区 域 ， 在 给 定时 间 间 隅 中 不 会 考虑 实际 的 
内 存 印 记 。 虽然 活 动 区域 会 随时 间 变 化 ， 但 这 些 变 化 是 渐进 的 。 局 部 性 原理 专注 于 这 种 程序 
趋势 ， 

局 部 性 原理 有 两 个 维度 ， 即 空间 和 时 间 。 空 间 局 部 性 指 的 是 程序 有 很 高 的 概率 访问 邻近 
的 内 存单 元 ， 如 果 它 访问 i， 就 很 有 可 能 访问 i-3 、i-2、i-1、it1、it2、i+3 等 。 这 一 现象 很 直观 。 
程序 的 指令 占用 连续 的 内 存单 元 。 类 似 地 ， 像 数组 或 记录 这 样 的 数据 结构 占用 连续 的 内 存单 
元 。 时 间 局 部 性 指 的 是 对 于 目前 经 常 访问 的 单元 i 在 不 久 的 将 来 会 有 很 高 的 概率 被 访问 。 这 
一 现象 也 很 直观 ， 考 虑 如 下 场景 ， 在 迭代 算法 中 ， 通 过 循环 重复 执行 相同 的 指令 来 更 新 数据 
结构 。 我 们 会 在 下 面 章节 中 利用 这 些 局 部 特性 来 进行 缓存 设计 。 


9.3 基本 术语 


我 们 现在 引入 一 些 很 直观 的 用 于 描述 分 级 存储 体系 性 能 的 术语 。 在 引入 前 ， 有 必要 重新 
回忆 一 下 第 2 章 提 到 的 工具 箱 和 工具 托盘 。 如 果 你 需要 一 个 工具 ， 你 首先 会 在 工具 托盘 中 寻 
找 。 如 果 工 具 托盘 中 有 需要 的 工具 ， 那 就 节省 了 去 工具 箱 中 寻找 工具 的 时 间 ; 如 采 工 具 托 盘 
中 没有 ， 你 就 要 去 保存 工具 箱 的 仓库 中 拿 工 具 ， 使 用 工具 ， 并 将 它 放 在 工具 托盘 中 。 通 常 ， 
如 果 在 工具 托盘 中 有 需要 的 工具 ， 那 么 整个 过 程 的 时 间 会 很 得 。 当 然 ， 有 时 工具 托盘 满 了 的 
时 候 你 也 要 将 一 部 分 工具 放 回 工具 箱 中 。 从 数学 的 角度 来 讲 ， 如 来 我 们 知道 能 够 从 工具 托盘 
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中 找到 工具 的 概率 ， 那 么 1 减 去 这 个 概率 就 是 去 工具 箱 中 寻找 工具 的 概率 。 
现在 我 们 来 定义 一 些 基 本 的 术语 。 
e 命中 (hit): 指 的 是 CPU 在 缓存 中 发 现 了 内 存 地 址 的 内 容 ， 这 样 就 避免 了 从 更 深层 的 分 
级 存储 体系 中 读 取 ， 这 就 像 在 工具 托盘 中 找到 了 工具 。 命中 举 (Ch) 是 CPU 在 缓存 中 成 
功 找 到 数据 的 概率 。 
eGR (miss): 指 的 是 CPU 没有 在 缓存 中 找到 要 找 的 数据 ， 因 此 导致 从 更 深层 的 分 级 存 
储 体系 中 读 取 数据 ， 这 就 像 在 工具 托盘 中 没有 找到 工具 ， 要 去 工具 箱 中 寻找 。 缺 失 率 
(m) 是 CPU 没有 在 缓存 中 找到 数据 的 概率 ， 等 于 1-/。 
。 缺失 损失 (miss penalty): 指 的 是 由 于 在 分 级 存储 体系 的 任何 一 层 中 发 生 缺 失 而 造成 的 
时 间 损 失 ， 这 就 像 在 工具 托盘 中 没有 找到 工具 而 去 工具 箱 中 寻找 所 造成 的 时 间 损 失 。 
。 有 效 内 存 访 问 时 间 (Effective Memory Access Time, EMAT): 指 的 是 CPU 的 有 效 访问 时 间 。 
EMAT 由 两 部 分 组 成 : 
a. 在 缓存 中 查找 CPU 要 访问 的 内 存单 元 所 花费 的 时 间 ， 定 义 为 缓存 访问 时 间 
(cache access time) 或 命中 时 间 (hit time ) 。 
b. 当 缓 存 中 缺失 时 ， 从 更 深层 的 存储 中 查找 并 读 取 缺失 数据 的 时 间 ， 和 定义 为 缺失 
损失 (miss penalty ) 。 
每 次 访问 内 存 ，CPU 都 会 有 第 一 部 分 的 时 间 。 第 二 部 分 ， 即 缺失 损失 ， 是 由 分 级 存储 体 
系 中 深层 的 访问 时 间 来 决定 的 ， 它 由 等 待 缺失 处 理 时 CPU 所 经 历 的 时 钟 周 期 的 数目 决定 。 缺 
失 损失 由 许多 因素 决定 ， 包 括 缓存 的 组 织 结构 和 主 存 系统 的 设计 细节 。 在 后 面 的 章节 中 我 们 
会 对 这 些 因 素 进 行 讲 解 。 由 于 CPU 只 有 在 发 生 缺 失 时 才 会 有 这 样 的 时 间 损 失 ， 所 以 为 了 计算 
第 二 部 分 ， 需 要 计算 CPU 所 需 的 内 存单 元 不 在 缓存 中 进而 需要 从 更 深层 存储 中 进行 调用 所 龙 
费 的 时 间 和 概率 (由 缺失 率 (m) 决定 )。 
m 代表 缺失 率 ， TT 代表 缓存 访问 时 间 ，7, 代表 缺失 损失 ， 那 么 


EMAT= T+mxT, (9-1 ) 


94 多 级 存储 层次 


现代 处 理 器 有 不 同等 级 的 缓存 。 例 如 ， 最 先进 的 处 理 融 (circa, 2009) 在 一 个 芯片 上 至 
少 有 二 级 缓存 ， 称 为 第 一 级 (first-level, L1) 缓存 和 第 二 级 (second-level, L2) 缓存 。 你 也 
许 会 想 ， 如 果 第 一 级 缓存 和 第 二 级 缓存 都 在 同一 个 芯片 上 ， 为 什么 不 可 以 合并 为 一 个 更 大 的 
缓存 ? ses mest einen ini leet ee de ( 即 命 中 时 间 ) 和 较 低 的 
缺失 率 。 一 方面 ， 我 们 希望 命中 时 间 越 短 越 好 并 与 处 理 器 的 时 钟 周期 保持 同步 。 因 为 缓存 的 
尺寸 对 访问 时 间 有 直接 的 影响 ， 所 以 我 们 希望 缓存 尽量 小 。 另 一 方面 ， 由 于 处 理 需 周期 时 间 
和 主 存 访问 时 间 之 间 的 差距 逐渐 拉 大 ， 所 以 我 们 希望 缓存 容量 大 一 些 。 为 了 解决 这 两 个 互 斥 
的 因素 ,我 们 采用 多 级 缓存 。 第 一 级 缓存 是 为 了 速度 上 的 加 速 ， 即 与 处 理 器 的 时 钟 周期 时 间 
同步 ， 所 以 很 小 。 第 二 级 缓存 的 速度 仅 影 响 第 一 级 缓存 没有 命中 造成 的 缺失 损失 ， 不 直接 影 
响 处 理 器 的 时 钟 周期 时 间 。 于 是 ,第 二 级 缓存 的 设计 主要 考虑 降低 缺失 率 ， 所 以 大 一 些 。 处 
理 器 安放 在 集成 电路 板 即 主板 上 ， 上 面 有 主 存 (物理 内 存 ) 9S。 企业 级 机 器 (数据库 或 服务 如 ) 
的 高 端 CPU 甚至 有 一 个 不 在 芯片 上 的 第 三 级 缓存 (L3 )。 考 虑 到 访问 速度 ， 这 些 多 级 绥 存 通 


日 “不同 级 的 缓存 的 访问 时 间或 大 小 随 着 技术 的 进步 不 断 变 化 
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常 应 用 SRAM 技术 。 
由 于 前 述 原因 ， 当 缓存 离 处 理 器 较 远 时 缓存 的 尺寸 较 大 。 如 果 5S, 表示 第 i 级 缓存 的 大 小 ， 那 么 
Sin Sina > > Sy > S; 
相应 地 ， 当 缓存 离 处 理 器 较 远 时 缓存 的 访问 时 间 较 长 。 如 果 工 是 第 i 级 的 访问 时 间 ， 那 么 
Lies = i eee T, >T, 


将 EMAT 术语 作为 一 个 整体 推广 到 分 级 存储 体系 ，T, 和 m 分 别 表 示 分 级 存储 体系 各 级 的 
访问 时 间 和 缺失 率 。 对 分 级 存储 体系 中 的 第 i 级 存储 ， 有 效 内 存 访问 时 间 由 下 式 递 归 得 出 : 
EMAT, = T, + m,X EMAT.,., (9-2 ) 


我 们 现在 来 定义 分 级 存储 体系 的 概念 : 

分 级 存储 体系 定义 为 包含 一 个 处 理 絮 能够 直接 或 间接 访问 的 指令 和 数据 的 所 有 存储 器 。 

直接 访问 的 意思 是 存储 器 对 于 ISA 来 说 是 可 见 的 。 间 接 访问 的 意思 是 对 于 ISA 来 说 是 不 
可 见 的 。 图 9-2 说 明了 这 一 定义 。 在 第 2 章 ， 我 们 介绍 了 寄存 器 的 概念 ， 它 是 对 于 从 ISA E 
接 访 问 的 离 处 理 器 最 近 也 是 最 快 的 数据 存储 。 通 常情 况 下 ，ISA 中 的 存 取 load/store 指令 和 算 
术 /逻辑 指令 访问 寄存 器 。L1、L2 Al L3 是 处 理 器 每 次 从 主 存 读 取 指 令 或 数据 时 都 会 访问 的 
不 同 级 别 的 缓存 。 通 常 L1 A L2 在 芯片 上 ，L3 不 在 芯片 上 9。 主 存 用 来 存储 程序 的 指令 和 数 
据 。 处 理 咒 显 式 地 访问 内 存 读 取 指令 (通过 程序 计数 器 ) 和 数据 (通过 load/store 指令 和 其 他 
使 用 内 存 操作 数 的 指令 )。 值 得 注意 的 是 有 些 结构 还 允许 处 理 器 通过 ISA 直接 访问 缓存 ( 例 
如 ， 刷 新 缓存 中 的 内 容 )。 二 级 存储 器 用 作 程 序 的 整个 内 存 印记 的 存储 ， 主 存 中 只 保存 其 中 的 
一 部 分 ， 这 与 第 8 章 中 讨论 的 工作 集 原 则 相 一 致 。 换 句 话 说， 二 级 存储 器 用 作 虚 拟 内 存 。 处 
理 器 遇 到 页 错误 时 就 隐 式 地 访问 虚拟 内 存 以 便 将 缺失 的 虚 页 引入 主 存 〈 即 物理 内 存 ) 中 。 


离 处 理 融 越 


ie 


离 处 理 器 越 远 


一 级 存储 器 
(虚拟 内 存 ) 
图 9-2 ”从 处 理 器 寄存 器 到 虚拟 内 存 的 整个 分 级 存储 体系 


日 ” 较 新 的 设计 将 L3 缓存 放 在 芯片 上 ( 见 本 章 小 结 后 的 例子 )。 


本 昔 主 要 讨论 包括 缓存 和 主 存 的 部 分 分 级 存储 体系 。 从 前 面 的 章节 (第 2、3 AS BE) 中 ， 
我 们 已 经 对 于 寄存 器 有 了 较 好 的 认识 。 类 似 地 ,在 第 7、8 章 中 我 们 对 于 虚拟 内 存 有 了 较 好 的 
了 了解。 在 本 曹 ， 我 们 主要 关注 缓存 和 主人 存 。 因 此 ， 在 本 草 剩 下 的 部 分 我 们 用 术语 缓存 层次 结 
构 (cache hierarchy) 和 分 级 存储 体系 (memory hierarchy) 来 表示 同一 事物 。 


考虑 如 图 9-3 所 示 的 三 级 存储 体系 。 计 算 有 效 内 存 访问 时 间 。 






| RAFAH, = 0.95; T,, = 2ns 


L2 RAFAH, = 0.80; T,, = 10 


T,, = 100ns 


图 9-3 三 级 存储 体系 
答 : 
EMAT = 7,2 + (1-A”,) X T,, = 10+(1-0.8) xX 100 = 30ns 
EMAT, , = 7, + (1-h,) X EMAT,, = 2+(1-0.95) x 30 = 2+1.5 = 3.5ns 
EMAT = EMAT,, = 3.5ns 


95 缓存 结构 


缓存 有 3 个 需要 注意 的 方面 : 布局 策略 、 查 找 算 法 和 有 效 性 。 

这 3 个 方面 分 别 与 下 面 的 3 个 问题 相对 应 : 

1) 从 内 存 中 读 取 的 数据 放 在 缓存 中 的 什么 位 置 ? 

2 ) 如 何 查 找 放 在 缓存 中 的 数据 ? 

3 ) 如 何 知 道 缓存 中 的 数据 是 有 效 的 ? 

一 个 用 于 内 存 地 址 到 缓存 的 映射 函数 是 回答 第 一 个 问题 的 关键 。 除 了 映射 卫 数 外 ， 第 二 
个 问题 的 答案 涉及 每 个 缓存 项 中 用 于 帮助 确定 缓冲 内 容 的 元 数据 。 第 三 个 问题 引出 了 为 了 辅 
助 查找 算法 ， 给 每 个 缓存 项 设置 一 个 有 效 位 的 必要 性 。 

本 书 中 我 们 通过 一 个 简单 的 直接 映射 ( direct-mapped) 缓存 例子 来 说 明 这 3 个 方面 的 内 
容 。 在 9.11 TA, 我 们 将 了 解 其 他 的 缓存 结构 ， 即 全 相关 (fully associative) 和 组 相关 ( set- 


associative )。 


96 ”直接 映射 缓存 结构 


吉 接 映射 的 内 存单 元 和 缓存 单元 有 一 对 一 的 关系 8。 也 就 是 说 ， 给 定 一 个 内 存 地 址 ,在 
缓存 中 有 唯一 确定 的 单元 存放 该 地 址 中 的 内 容 。 为 了 更 清楚 地 表述 直接 映射 的 工作 ， 我 们 考 


日 “当然 ,由 于 缓存 比 内存 小 ， 所 以 在 一 组 内 存单 元 和 给 定 的 缓存 单元 之 间 存 在 着 多 对 一 的 关系 。 


X 
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不 一 个 简单 例子 一 一 16 字 的 内 存 和 8 字 的 缓存 (如 图 9-4 所 示 )。 图 中 的 阴影 显示 内 存单 元 
0 ~ 7 分 别 对 应 于 缓存 单元 0 ~ 7; 类 似 地 ， 内 存单 元 8 ~ 16 也 分 别 对 应 于 缓存 单元 0 ~ 7. 


内 存 
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图 9-4 直接 映射 缓存 。 在 内 存单 元 和 缓存 单元 之 间 存 在 一 对 一 的 映射 


在 回答 查找 和 有 效 性 问题 之 前 ， 我 们 首先 了 解 直接 映射 的 缓存 中 关于 内 存单 元 的 布局 策 
略 。 为 了 更 好 地 进行 说 明 ， 假 设 缓存 为 空 ， 考 虑 如 下 的 内 存 地 址 访问 : 

0,1,2,3,1,3,0,8,0,9,10 ( 均 为 十 进 制 地 址 信息 ) 

因为 缓存 最 初 为 空 ， 所 以 前 4 个 访问 (地 址 0，1， 
2,3) 在 缓存 中 均 为 缺失 ，CPU 从 内 存 中 读 取 信息 并 将 
它们 保存 在 缓存 中 。 图 9-5 显示 了 处 理 完 前 4 次 内 存 访 
问 后 的 缓存 。 这 些 缺 失 都 是 不 可 避免 的 ， 称 为 强制 缺失 
(compulsory miss)， 因 为 初始 时 缓存 为 空 。 

接 下 来 的 3 个 CPU 访问 (地 址 为 1，3，0 ) 在 缓存 中 
命中 ， 这 样 避免 了 从 内 存 中 查找 数据 。 我 们 看 看 在 接 下 来 
的 CPU 访问 中 将 发 生 什 么 (地址 8 )。 这 个 访问 在 缓存 中 
k, CPU 从 内 存 中 读 取 数据 。 现 在 我 们 需要 弄 清楚 系统 
从 内 存单 元 中 读 取 的 数据 将 放 在 缓存 中 的 什么 位 置 。 缓 存 ”图 9-5 在 前 4 次 访问 后 的 绥 存 内 容 
在 单元 4 ~ 7 有 空间 。 然 而 ， 使 用 直接 映射 缓存 单元 ,0 是 存储 内 存单 元 8 的 唯一 位 置 。 图 9-6 
显示 了 缓存 的 这 一 状态 。 这 也 是 强制 缺失 ， 因 为 内 存单 元 8 的 内 容 初始 时 没有 在 缓存 中 。 

考虑 下 一 个 访问 (地址 0 )。 这 个 访问 在 缓存 中 也 是 缺失 的 ，CPU 需要 从 内 存 中 读 取 它 并 
把 它 存储 在 缓存 单元 0， 这 也 是 内 存单 元 0 的 唯一 位 置 。 图 9-7 显示 了 缓存 中 的 新 内 容 。 这 个 
缺失 的 发 生 是 由 于 内 存单 元 0 和 8 都 映射 到 缓存 中 的 同一 位 置 造 成 冲突 所 引起 的 ， 因 此 这 也 
称 为 冲突 缺失 。 尽 管 在 缓存 中 有 空闲 的 空间 ,但 由 于 直接 映射 还 是 会 有 冲突 缺失 发 生 。 注 意 
前 面 的 缺失 (图 9-6 中 的 单元 8 ) 也 会 造成 冲突 ， 因 为 单元 0 的 数据 已 经 保存 在 缓存 中 。 忽 略 
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这 种 情况 ， 第 一 次 访问 内 存单 元 会 造成 缺失 ， 这 也 是 为 什么 我 们 把 图 9-6 中 的 缺失 归 为 强制 
缺失 。 我 们 在 9.15 节 再 详细 讨论 这 两 种 不 同 种 类 的 缺失 。 










缓存 缓存 

0| 。 内 存单 元 98 0| 内 存单 元 980 | 

1| 内 存单 元 1 

2 :| mW | 

| Wen | ates 

(= (oe 

[= 

a ' 

图 9-6 内 存单 元 0 HEH 8 图 9-7 内 存单 元 8 被 替换 为 0 (冲突 缺失 ) 

9.6.1 缓存 查找 


到 目前 为 止 ， 我 们 知道 了 CPU 和 内 存 之 间 的 信息 交换 ， 或 者 称 为 握手 (handshake) : 
CPU 提供 地 址 和 命令 (例如 ， 读 ) 并 从 内 存 中 读 取 数据 。 绥 存 的 引入 〈 见 图 9-1) 改变 了 简单 
设置 。CPU 首先 查找 绥 存 确定 需要 的 数据 是 否 在 缓存 中 。 只 有 发 生 缺 失 才 会 使 CPU 进行 标准 
的 CPU 和 内 存 间 的 握手 。 

下 面 介绍 CPU 如 何在 缓存 中 查找 对 应 的 内 存单 元 。 特 别 地 ， 我 们 需要 搞 清楚 CPU 中 的 
索引 如 何 通过 直接 映射 提交 给 缓存 。 重 新 看 看 图 9-4, 我们 可 以 看 到 CPU 地 址 如 何 映射 到 它 
们 对 应 的 缓存 索引 。 

可 以 按照 下 式 计 算 缓存 索引 的 数值 : 


内 存 地 址 mod 缓存 大 小 
例如 ， 给 定 内 存 地 址 15, BARS 
15 mod 8 =7 
类 似 地 ， 内 存 地 址 7 所 对 应 的 缓存 索引 为 
7 mod 8 = 7 


基本 上 ， 为 了 建立 缓存 索引 ， 我 们 简单 地 取 内 存 地 址 中 能 够 表示 缓存 大 小 的 最 低 几 位 。 在 我 
们 前 面 的 例子 中 ， 因 为 缓存 有 8 项， 所 以 需要 3 位 作为 缓存 索引 (内存 地 址 的 最 低 3 位 )。 

假设 CPU 需要 从 内 存 地 址 8 读 取 数据 ，1000 是 内 存 地 址 的 二 进 制 表示 ， 缓 存 索 引 是 
000。CPU 在 索引 000 处 查找 缓存 单元 。 我 们 需要 一 些 方法 来 了 解 该 缓存 项 的 内 容 是 来 自 内 
存单 元 0 还 是 8。 所 以 ,除了 数据 外 ， 我 们 在 每 个 缓存 项 中 还 需要 获取 额外 的 信息 来 处 理 多 
个 内 存 地 址 对 应 同一 缓存 地 址 的 情况 。 内 存 地 址 用 于 产生 缓存 索引 的 位 已 经 可 以 用 来 实现 这 
一 目的 。 我 们 将 这 一 额外 的 信息 (存储 在 缓存 中 ) 称 为 标记 (tag)。 例 如 ， 内 存 地 址 0000 和 
1000 的 最 高 有 效 位 的 标记 分 别 为 0 和 1。 所以， 对 于 每 个 缓存 项 需要 1 位 标记 ( 见 图 9-8 )。 
如 果 CPU 需要 访问 内 存单 元 11， 它 就 在 缓存 中 查找 单元 11 mod 8 一 一 缓存 中 的 单元 3。 这 个 
单元 的 标记 是 0。 所 以 ,缓存 项 中 包含 的 数据 对 应 于 内 存单 元 3 (二 进 制 地 址 为 0011 )， 而 不 
是 内 存单 元 11 (二 进 制 地 址 为 1011 )。 
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假设 CPU 产生 内 存 地 址 0110 (内 存 地 址 6 )。 我 们 假设 这 是 内 存 地 址 6 第 一 次 被 CPU 
访问 。 所 以 ， 它 不 可 能 出 现在 缓存 中 。 我 们 看 看 当 CPU 试图 读 取 内 存单 元 6 时 会 发 生 什么 。 
CPU 会 首先 查找 缓存 中 单元 6 (6 mod 8 )。 如 果 标 记 恰 巧 为 0,， 那 么 CPU 会 假定 这 个 数据 对 
应 于 内 存单 元 6。 那么 ,在 这 个 例子 中 CPU 就 不 会 去 内 存 中 查找 数据 ; 这 里 标记 位 恰巧 为 0。 
所 以 ， 在 这 个 缓存 项 中 的 数据 并 不 与 实际 内 存单 元 6 相对 应 。 我 们 可 以 看 出 这 是 错误 的 ， 并 
且 它 说 明 对 每 个 缓存 项 我 们 需要 更 多 的 信息 来 避免 这 种 错误 。 标 记 对 于 消除 缓存 中 当前 的 内 
存单 元 歧义 很 有 用 ， 但 它 并 不 能 确定 缓存 项 是 否 有 效 。 为 了 解决 这 一 问题 ， 我 们 为 缓存 中 的 
每 项 增加 了 有 效 位 ( 见 图 9-9 )。 














标记 数据 有 效 位 标记 “数据 
[E mines os | + rs 
[el wines [ao ese 
fe] wen. ala] «tense 
fel wanes ofa] © tenses 
[T o = 
[LT DOES 
[e DOES 
OO DEE 
图 9-8 每 项 中 带 有 标记 字段 和 数据 字段 的 直接 图 9-9 每 项 带 有 有 效 字 段 、 标 记 字 段 和 数据 字段 
映射 缓存 。 标 记 字 段 唯一 地 标识 给 定 组 的 直接 映射 缓存 。 标 记 字 段 中 标 为 “X” 代 
存单 元 中 的 实际 内 存单 元 表 当 前 条 件 下 “不 关心 取 值 ” 


96.2 ”缓存 项 中 的 字段 


对 上 文 进行 总 结 ， 每 个 缓存 项 都 包含 3 个 字段 ( 见 图 9-10 )。 因 此 ， 从 查找 缓存 的 角度 ， 
CPU 产生 的 内 存 地 址 有 两 部 分 : 标记 和 上 索引。 索引 是 CPU 产生 的 包含 内 存 地 址 的 具体 缓存 单 
元 ; 标记 是 地 址 的 一 部 分 ， 它 有 助 于 消除 具体 缓存 项 的 内 容 的 歧义 ( 见 图 9-11 )。 我 们 用 内 存 
地 址 的 最 低 有 效 位 〈 即 最 右边 的 位 ) 作为 缓存 索引 来 利用 空间 局 部 性 原理 。 例 如 ， 在 我 们 的 简 
单 缓存 中 ， 如 果 用 内 存 地址 的 最 高 3 位 作为 缓存 索引 ， 那 么 内 存单 元 0 和 1 将 映射 到 缓存 中 
的 同一 地 址 。 





图 9-10 ”每 个 缓存 项 的 不 同 字 段 





图 9-11 对 CPU 产生 的 内 存 地 址 进行 转换 ， 以 便 缓存 查找 


图 9-4 有 8 项 直接 映射 缓存 ， 考 虑 内 存 地 址 0，1，0，1 的 访问 序列 。 假 设 内 存 地 址 的 
最 高 3 位 用 作 缓 存 索引 ， 最 低位 (因为 在 本 例 中 内 存 地 址 只 用 4 位 表示 ) 用 作 标 记 。 图 9-12 
显示 了 每 次 访问 后 缓存 的 内 容 。 注 意 ， 即 使 剩余 的 缓存 为 空 ， 内 存 访 问 序列 中 的 相同 缓存 项 
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(缓存 中 的 第 一 行 ) 是 如 何 被 重用 的 。 每 次 访问 都 产生 缺失 ， 在 该 访问 模式 下 会 替换 缓存 中 前 
一 次 的 内 容 。 

图 9-12 中 的 情况 很 不 理想 。 回 忆 9.2 节 提 到 的 局 部 性 原理 (时间 和 空间 局 部 性 )。 连 续 的 | 
内 存 访问 应 该 映射 到 不 同 的 缓存 单元 中 。 这 就 是 选择 图 9-11 中 地 址 转换 的 原因 。 365 


有 效 位 标记 数据 ”有 效 位 标记 ”数据 






有 效 位 标记 数据 ”有 效 位 标记 数据 
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图 9-12 ”将 内 存 地 址 中 的 最 高 有 效 位 作为 缓存 索引 的 内 存 访问 序列 


96.3 ”用 于 直接 映射 缓存 的 硬件 


我 们 首先 对 之 前 讨论 的 想法 进行 总 结 。 图 9-13 显示 了 直接 映射 缓存 的 人 硬件 结构 。 
内 存 地 址 


SRA 


图 9-13 ”用 于 直接 映射 缓存 的 硬件 。 灰 色 项 是 通过 缓存 索引 选中 的 缓存 单元 


内 存 地 址 的 索引 部 分 选择 缓存 中 的 特定 项 (图 9-13 中 灰色 的 缓存 项 )。 图 9-13 中 的 比较 
器 将 这 一 项 的 标记 字段 与 内 存 地 址 的 标记 字段 进行 比较 。 如 果 是 匹配 的 上 且 这 一 项 是 有 效 的 ， 
那么 它 会 发 出 一 个 命中 信号 。 因 为 命中 ， 所 以 缓存 将 选中 项 的 数据 字段 (也 称 为 缓存 行 ) 发 送 
给 CPU。 缓存 块 (cache block) 是 另 一 个 与 缓存 行 类 似 的 术语 。 我 们 目前 已 经 用 了 3 个 类 似 的 
术语 : 缓存 项 、 缓 存 行 和 缓存 块 。 虽 然 有 这 么 多 的 术语 对 应 同一 个 事物 ,但 是 还 是 请 读者 记 [B366 
住 这 些 名 词 ， 因 为 计算 机 体系 结构 书 中 经 常 互 换 地 使 用 这 些 术语 。 

注意 ， 缓 存 中 需要 的 真实 存储 空间 比 缓存 的 数据 部 分 大 。 有 效 位 和 标记 字段 称 为 元 数据 
(metadata)， 用 来 管理 存储 在 缓存 中 的 真实 数据 ， 它 也 代表 空间 开销 。 

目前 为 止 ， 我 们 已 经 把 内 存单 元 对 应 到 缓存 的 数据 字段 中 。 内 存单 元 的 大 小 由 指令 集 所 
允许 的 内 存 访问 粒度 决定 。 例 如 ， 如 果 体 系 结构 是 按 字 节 寻 址 的 ， 那 么 1 字 节 就 是 内 存 操作 
数 最 小 的 可 能 尺寸 。 通 常 ， 在 这 样 的 体系 结构 中 ， 字 宽 为 几 个 整数 字 节 。 我 们 可 以 将 每 个 字 
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节 放 在 不 同 的 缓存 行 中 ， 但 从 9.2 市 我 们 知道 ， 空 间 局 部 性 原理 建议 如 果 访 问 字 的 一 个 字 节 ， 
那么 很 可 能 会 访问 同一 字 的 其 他 字 节 。 所 以 ， 即 使 体系 结构 是 按 字 节 寻 址 的 ， 在 每 个 缓存 行 
中 保留 完整 的 字 也 是 很 有 意义 的 。 因 此 ,CPU 产生 的 内 存 地 址 将 被 转换 成 3 个 字段 (如 图 9-14 
所 示 ) : 缓存 标记 、 缓 存 索 引 和 字 节 偏 移 量 。 字 节 偶 移 量 定义 为 区 分 一 个 字 中 不 同 字 节 的 地 址 
人 位。 例如， 如果 字 宽 是 32 位 且 体 系 结构 是 按 字 节 寻 址 的 ， 那 么 地 址 中 的 最 低 2 位 就 是 字 节 偶 
移 量 。 





我 们 考虑 真实 内 存 系统 的 直接 映射 缓存 的 设计 。 假 设 CPU 产生 一 个 32 位 的 按 字 节 寻 址 的 内 存 地 
址 。 每 个 内 存 字 包 含 4 字 节 。 一 次 内 存 访问 将 整个 字 装 入 缓存 中 。 直 接 映射 缓存 是 64KB (这 就 是 缓存 能 
够 存储 的 数据 量 )， 每 个 缓存 项 包含 数据 的 一 个 字 。 计 算 缓 存 中 用 于 有 效 位 和 标记 字段 的 额外 存储 空间 。 
答案 : 
假设 使 用 小 端 存储 ，0 是 地 址 中 的 最 低 有 效 位 。 用 这 种 标记 法 ， 地 址 的 最 低 两 位 ， 即 位 1 和 位 
0， 区 分 一 个 字 地 址 中 的 字 节 。 一 个 缓存 项 保存 字 中 全 部 4 个 字 节 。 于 是 ， 地 址 的 最 低 两 位 用 来 只 
一 地 决定 一 个 字 中 的 字 节 ， 不 需要 唯一 地 识别 特定 的 缓存 项 。 所 以 ， 这 些 位 不 用 来 做 缓存 查找 的 索 
引 部 分 。 
缓存 大 小 与 每 项 中 保存 的 数据 大 小 的 比 是 缓存 项 数 : 


64KB/ (4 字 节 / 字 ) = 16K 项 
16K 项 需要 14 位 来 枚 举 。 因 此 位 2 ~ 15 形 成 缓存 索引 ， 剩 下 的 位 16 ~ 31 形成 标记 。 这 样 ， 
每 个 缓存 项 都 有 16 位 标记 。 
每 项 的 元 数据 : 16 位 标记 位 +1 位 有 效 位 =17 位 。 
因此 ， 元 数据 需要 的 额外 存储 空间 为 
17 位 X16K 项 =17X16384=278528 位 
下 图 显示 了 这 个 问题 的 缓存 设计 : 


缓存 索引 | 字 节 偏 移 量 

31 1615 21 0 
有 效 位 标记 数据 
(位 ) 06 位 ) (32 位 ) 





"re GDS), 交加 
| “ss | 
传人 CPU 


P p 的 数据 


缓存 需要 的 总 空间 (真实 数据 十 元 数据 ) 
=64KB + 278 528 
=524 288 + 278 528 
=802 816 
空间 开销 = 元 数据 /总 空间 = 278 528/802 816 = 35% 


我 们 看 看 如 何 减 少 空 间 开 销 。 在 例 9-2 中 ， 每 个 缓存 行 保存 一 个 内 存 字 。 一 种 减少 空间 
开销 的 方式 是 修改 缓存 设计 ， 使 每 个 缓存 行 保存 多 个 连续 的 内 存 字 。 例 如 ， 考 虑 在 例 9-2 中 
每 个 缓存 行 保 存 连 续 的 4 个 内 存 字 。 这 将 把 缓存 行 的 数目 降低 到 4K。 块 大 小 (block size) 用 
来 指出 每 个 缓存 行 中 连续 的 数据 数 。 在 例 9-2 中 块 大 小 是 4 字 节 。 如 果 每 个 缓存 行 包 含 4 个 
字 ， 那 么 块 大 小 就 是 16 字 节 。 为 什么 想 要 一 个 更 大 的 块 大 小 呢 ? 而 且 ， 这 将 如 何 帮助 我 们 减 
少 空间 开销 ? 这 能 帮助 提升 内 存 系统 的 整体 性 能 吗 ? 读者 先 思考 这 些 问 题 。9.10 节 再 进行 块 
大 小 对 缓存 设计 影响 的 详细 讨论 。 


9.7 流水线 处 理 器 设计 的 影响 


前 面 介 绍 了 内 存 和 处 理 天 之 间 的 缓 仔 ， 我 们 重新 来 看 流水 线 处 理 天 设计 和 缓存 中 指令 的 
执行 。 图 9-15 是 第 6 Bt CULPA 6-6 ) 流水 线 处 理 需 的 图 ， 
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注意 我 们 已 经 将 部 分 存储 器 做 了 替换 ， 在 IF 和 MEM 阶段 的 LTMEM 和 D-MEM 分 别 换 
成 了 I 缓存 和 DD 缓存 。 假 设 访问 命中 ,缓存 使 下 和 MEM 阶段 与 其 他 流水 线 阶段 有 类 似 的 周 
期 时 间 。 我 们 看 看 如 果 绥 存 访问 缺失 会 发 生 什 么 。 
。 在 IF 阶段 缺失 : “IRAN, IF 阶段 向 内 存 发 送 访 问 来 读 取 指令 。 正 如 我 们 所 知 ， 
内 存 访问 时 间 是 CPU 时 钟 周期 的 10 倍 。 直 到 指令 从 内 存 中 读 人 缓存 ，IF 阶段 才 停 止 
向 下 一 阶段 发 送 空 指令 (NOP). 

。 在 MEM 阶段 缺失 : 在 D 缓存 中 缺失 只 与 内 存 访问 指令 (load/store) 相关 。 与 正 阶段 
类 似 ， 直 到 内 存 访问 完成 ，MEM 阶段 的 缺失 才 停 止 向 WB 阶段 发 送 空 指令 。 在 执行 缺 
失 指 令 前 它 也 不 会 执行 目前 正在 执行 的 从 过 去 阶段 读 取 的 其 他 指令 。 

我 们 将 内 存 延 迟 (memory stall) 定义 为 等 待 需要 完成 的 内 存 操 作 所 浪费 的 处 理 器 周期 。 
内 存 延 迟 有 两 方面 : 处 理 器 读 访 问 缓存 造成 的 读 延 迟 (read stall); 处 理 器 写 访问 缓存 造成 的 
ER (write stall) 。 我 们 将 在 下 一 节 定 义 和 讲 解 这 些 延 迟 ， 同 时 也 会 介绍 如 何 避 免 它 们 ， 因 
为 这 些 对 处 理 器 流水 线性 能 起 决定 性 作用 。 


9.8 缓存 读 / SAK 
在 本 节 ， 我 们 讨论 读 / 写 缓存 的 策略 和 机 制 。 不 同 级 的 缓存 会 选择 不 同 的 策略 。 
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9.8.1 CPU 对 缓存 的 读 访问 


处 理 需 需要 访问 缓存 来 读 取 内 存单 元 中 的 指令 或 数据 。 在 LC-2200 ISA 五 阶段 流水 线 中 ， 

这 可 能 由 于 在 IF 阶段 读 取 指 令 或 在 MEM 阶段 为 了 加 载 指令 而 读 取 操 作 数 决定 。 处 理 器 和 组 
存 采 取 的 步骤 如 下 : 

。 步 骤 一 : CPU 将 内 存 地 址 的 索引 部 分 ( 见 图 9-16) 发 送 给 缓存 。 缓 存 进行 查找 ， 如 果 

成 功 (缓存 命中 )， 它 将 数据 发 送 给 CPU。 如 果 缓 存 发 送 缺失 信号 ， 那 么 CPU 将 地 址 通 

过 内 存 总 线 发 送 给 主 存 。 原 则 上 ， 所 有 这 些 动 作 都 发 生 在 同一 周期 中 (流水 线 的 正 或 
MEM 阶段 )。 





c) BS d) AS 
”图 9-16 读 写 操作 时 ，CPU、 缓 存 和 内 存 间 的 交互 


(PR: 在 向 内 存 发 送 地 址 后 ， 直 到 收 到 来 自 内 存 的 数据 ，CPU 会 一 直 回 下 一 阶段 发 
送 空 指令 (NOP)。 读 延迟 定义 为 处 理 一 个 读 缺 失 所 花费 的 处 理 器 时 钟 周 期 数 。 正 如 前 
面 提 到 的 ， 由 于 内 存 速度 较 慢 ， 这 可 能 会 花费 多 个 CPU 周期 。 缓 存 分 配 一 个 缓存 块 来 
接收 内 存 块 。 最 后 ， 主 存 将 数据 传送 给 CPU， 同 时 用 数据 更 新 分 配 的 缓存 块 。 缓 存 修 
改 这 个 缓存 项 的 标记 字段 并 将 有 效 位 设置 为 有 效 。 


9.8.2 CPU 对 缓存 的 与 访问 
当 有 对 内 存单 元 进行 写 操作 的 指令 时 ， 处 理 器 会 对 缓存 进行 写 访 问 。 在 我 们 实现 的 LC- 
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2200 ISA 五 阶段 流水 线 中 ， 这 可 能 发 生 在 MEM 阶段 中 ， 用 于 存储 内 存 操作 数 。 处 理 器 对 组 
存 的 写 访 问 有 两 种 处 理 方 式 : 直 写 (write through) 和 回 写 (write back), 
直 写 策略 。 主 要 思想 是 对 于 每 个 CPU 写 操作 都 更 新 缓存 和 主 存 。 处 理 器 和 缓存 采取 的 基 
本 步骤 如 下 : 
。 步 骤 一 : 在 每 次 写 操 作 ( LC-2200 中 的 存储 指令 )，CPU 都 简单 地 向 缓存 写 数 据 。 没 有 
必要 检查 有 效 位 或 缓存 标记 。 缓 存 会 更 新 相关 项 的 标记 字段 并 设置 有 效 位 。 这 些 操作 
都 在 流水 线 的 MEM 阶段 发 生 。 
e 步骤 二 : 同时 ，CPU 回 主 存 发 送 地 址 和 数据 。 当 然 ， 因 为 内 存 访问 要 耗费 好 几 个 CPU 
周期 去 完成 ， 所 以 这 很 影响 性 能 。 为 了 减轻 这 个 性 能 瓶 贷 ， 通 常会 在 CPU 和 内 存 之 间 
的 数据 通路 中 安置 一 个 写 缓冲 区 (write buffer), MA 9-17 所 示 。 写 缓冲 区 是 一 个 用 来 
缓解 CPU 和 内 存 之 间 速 度 差异 的 小 硬件 存储 器 (和 寄存 器 堆 类 似 )。 对 于 CPU MA, 
一 旦 将 地 址 和 数据 都 放 在 写 缓冲 区 中 ， 写 操作 就 完成 了 。 因 此 ， 该 操作 发 生 在 流水 线 
的 MEM 阶段 ， 不 影响 流水 线 的 性 能 。 





图 9-17 为 了 缓和 CPU 与 主 存 速度 上 的 差距 ,使 用 4 个 写 缓冲 区 单元 的 直 写 策略 。 只 要 
地 址 和 数据 已 放 入 写 缓冲 区 中 ， 处 理 器 写 操作 就 完成 了 ,并且 流水 线 可 以 恢复 
工作 。 写 缓冲 区 中 的 数据 会 在 后 人 台 被 传送 到 内 存 ， 这 是 与 流水 线 操作 同时 进行 
的 。 如 果 写 缓冲 区 满 ， 那 么 流水 线 停止 


。 步骤 三 : 写 缓冲 区 独立 于 CPU， 完 成 主 存 的 写 操作 。 注 意 ， 如 果 在 处 理 絮 试图 向 写 绥 
冲 区 写 数 据 时 写 缓冲 区 满 ， 那 么 流水 线 会 受阻 直到 写 缓冲 区 中 的 一 项 被 存 人 内 存 为 止 。 
写 延 迟 定 义 为 写 操作 浪费 的 处 理 器 时 钟 周 期 数 (忽略 命中 或 在 缓存 中 缺失 的 情况 )。 

采用 直 写 策略 ， 当 发 生 写 缺 失 时 ， 采 取 不 同 的 缓存 块 分 配 策略 写 延 迟 会 有 不 同 的 表现 。 

对 于 缺失 情况 ， 有 两 种 缓存 块 分 配 策略 : 

。 写 分 配 : 这 是 一 种 通常 处 理 写 缺失 的 方法 。 直 觉 上 正在 写 的 数据 在 将 来 也 会 被 程序 用 
到 ， 所 以 应 该 将 它 存 人 缓存 中 。 然 而 ， 因 为 在 缓存 中 这 个 块 也 是 缺失 的 ， 所 以 我 们 不 
得 不 分 配 一 个 缓存 块 ， 并 将 缺失 的 内 存 块 写 和 其中。 从 这 点 上 看 ， 写 缺失 和 读 缺 失 的 
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操作 类 似 。 在 直接 映射 缓存 中 ， 接 收 内 存 块 的 缓存 块 是 提前 确定 的 。 然 而 ， 正 如 我 们 

后 面 将 看 到 的 灵活 布局 策略 ( 见 9.11 节 )， 分 配 策略 由 其 他 的 设计 因素 决定 。 

。 非 写 分 配 : 这 是 一 种 不 常用 的 处 理 写 缺失 的 方法 。 因 为 处 理 器 不 需要 数据 ， 所 以 写 访 

问 能 够 很 快 地 完成 。 处 理 右 只 是 简单 地 将 要 写 的 数据 写 入 写 缓冲 区 中 以 便 完成 流水 线 

中 MEM 阶段 需要 的 操作 。 于 是 ， 因 为 缺失 的 内 存 块 不 需要 从 内 存 中 读 出 ， 所 以 也 有 写 

延迟 。 

回 写 策略 。 核 心思 想 是 当 CPU 写 操作 时 只 更 新 缓存 。 处 理 右 和 缓存 采取 的 主要 步骤 如 下 : 

。 步 骤 一 : CPU 与 缓存 之 间 的 交互 和 直 写 策略 相同 。 我 们 假设 内 存单 元 已 经 在 缓存 中 (E 

写 合 中 )。CPU 向 缓存 中 写 数据 。 缓 存 更 新 相关 项 的 标记 字段 并 设置 有 效 位 。 这 些 操作 

都 发 生 在 流水 线 的 MEM 阶段 。 

。 步骤 二 : 选中 的 缓存 项 和 对 应 的 内 存单 元 中 的 内 容 是 不 一 样 的 。 对 CPU 而 言 这 不 是 问题 ， 

因为 在 内 存 读 操作 之 前 首先 要 检查 缓存 。 因 此 ，CPU 总 是 获取 缓存 中 的 最 新 数据 。 

。 FRIZ: 我 们 考虑 在 何 时 更 新 主 存 。 绥 存 总 是 比 主 存 小 。 因 此 ， 在 某 个 时 刻 ， 可 能 需 

要 替换 现 有 的 缓存 项 ， 为 现在 没 在 缓存 中 的 内 存单 元 腾 出 空间 (我 们 将 在 9.14 节 讨 论 

缓存 的 蔡 换 策略 )。 在 进行 替换 上 时， 如 果 CPU 写 和 人 要 被 替换 的 缓存 项 ， 那 么 相应 的 内 

存单 元 要 用 该 缓存 项 的 最 新 数据 更 新 。 

处 理 器 对 写 缺 失 的 处 理 和 读 缺 失 一 样 。 在 采取 了 必要 的 处 理 读 缺 失 的 步骤 之 后 ， 进 行 前 
面 介绍 的 写 操 作 。 

我 们 需要 一 些 机 制 来 判断 缓存 项 中 的 数据 是 否 比 相应 内 存单 元 中 的 数据 新 。 每 个 缓存 项 
中 的 元 数据 (有 效 位 和 标志 字段 ) 没有 为 缓存 决策 提供 必要 的 信息 。 所 以 ,我 们 给 每 个 缓存 项 
增加 一 个 新 的 元 数据 一 一 脏 位 (dirty bit)， 见 图 9-18. 


内 存 地 址 


缓存 索引 





图 9-18 采用 回 写 策略 的 直接 映射 缓存 结构 。 每 项 都 有 一 个 额外 的 字段 ( 脏 位 ) 用 来 指示 
块 是 否 为 脏 。 水 平 阴影 部 分 的 块 是 缓存 索引 选择 的 块 


缓存 用 下 述 方法 使 用 脏 位 : 

。 当 处 理 缺 失 (缺失 将 内 存单 元 装 入 缓存 项 ) 时 ， 绥 存 清除 脏 位 。 

。 当 CPU 进行 写 操作 时 缓存 设 置 脏 位 。 

。 当 蔡 换 时 ， 绥 存 将 缓存 中 的 数据 回 写 到 相应 内 存单 元 中 。 注 意 这 与 虚拟 内 存 系统 〈( 见 第 

8 章 ) 中 将 物理 页 帧 回 写 到 磁盘 的 操作 类 似 。 

我 们 介绍 了 直 写 策略 中 的 写 缓冲 区 的 概念 。 结 果 是 对 于 回 写 策略 ， 写 缓冲 区 也 是 很 有 用 
的 。 注 意 ， 我 们 的 目的 是 让 处 理 器 更 高 效 。 这 意味 着 应 该 尽 可 能 快 地 将 缺失 的 内 存 块 引 入 绥 


存 。 换 句 话 说 ， 将 缺失 的 块 引 入 缓存 比 回 写 要 替换 的 脏 块 更 重要 。 这 时 ， 写 缓冲 区 也 派 上 了 
用 场 ， 优 先 从 内 存 读 数据 ， 而 不 是 向 内 存 写 数据 。 把 要 被 替换 的 块 (如 果 脏 了 ) 存放 在 写 缓冲 
区 中 ， 它 最 终 会 被 写 回 。 但 发 送 给 内 存 的 立即 请 求 是 对 目前 的 缺失 进行 处 理 ( 读 或 写 缺 失 )。 
当 CPU 没有 要 人 处理 的 读 或 写 缺失 时 ， 来自 写 缓冲 区 的 写 请 求 才 会 传送 到 内 存 。 这 容易 让 人 想 
起 内 存 管理 需 优 先 从 磁盘 读 取 缺失 页 ， 而 不 是 将 脏 的 页 面 写 人 磁盘 COL 8.4.1 节 )。 

两 种 与 策略 的 对 比 。 绥 存 应 该 采用 哪 种 写 策 略 呢 ?7 答案 是 取决 于 很 多 因素 。 一 方面 ， 直 
写 策略 确保 主 存 中 的 数据 永远 都 是 最 新 的 。 人 然而， 这 是 以 每 次 写 操作 都 要 向 主 存 发 送 数 据 为 
代价 的 。 可 以 采取 一 些 优 化 措施 ， 例 如 ， 如 果 总 是 向 写 缓 冲 区 中 的 同一 内 存单 元 重复 地 进行 
PRE ( 即 还 没有 被 传人 内存)， 那 么 它 可 以 用 一 个 新 的 写 操 作 代 兰 。 然 而 ， 在 程序 中 发 生 这 
种 情况 的 概率 很 小 。 男 一 种 优化 ， 称 为 写 合并 (write merging)， 是 将 要 写 人 同一 内 存 块 的 不 
同 部 分 的 独立 写 操 作 合 并 在 一 起 。 回 写 策略 的 优点 是 速度 快 ， 并 且 重 要 的 是 ，CPU 每 次 写 访 
问 都 不 使 用 内 存 总 线 。 因 此 ， 对 于 同一 内 存单 元 的 重复 写 操作 并 不 会 导致 内 存 总 线 上 的 流量 
过 载 。 只 有 当 被 替换 时 缓存 才 会 用 内 存单 元 中 最 新 的 数据 更 新 内 存 。 在 这 种 情况 下 ， 注 意 对 
于 回 写 策略 ， 为 了 保存 需要 回 写 到 主 存 的 蔡 换 数据 ， 写 绥 冲 区 也 是 很 有 用 的 。 

直 写 策略 的 另 一 个 优点 是 缓存 永远 是 干净 的 。 换 句 话 说 ， 当 需要 把 缓存 中 的 块 蔡 换 为 缺 
失 块 时 ， 缓 存 永 远 不 需要 把 被 蔡 换 的 块 写 人 更 低级 的 存储 器 中 。 这 样 对 缓存 进行 直 写 操作 ， 
设计 上 更 简单 并 且 速 度 比 回 写 缓存 更 快 。 所 以 ， 如 果 处 理 硕 有 多 级 缓存 ， 那 么 对 于 离 处 理 关 
较 近 的 缓存 通常 来 用 直 写 策略 。 例 如 ， 大 部 分 现代 处 理 需 对 L1 级 D 缓 存 采 用 直 写 策略 ， 对 
于 L2 Al L3 级 缓存 采用 回 写 策略 。 

我 们 将 在 第 10 和 12 章 中 看 到 ， 写 策略 的 选择 会 对 IO 和 多 处 理 右 系统 的 设计 产生 影响 。 
采用 不 同 的 策略 各 有 利 刺 ， 回 写 策略 会 降低 内 存 总 线 的 流量 ; TREY, ES RMR RETR TA 
是 最 新 的 。 


9.9 ”处理 器 流水 线 中 的 缓存 缺失 处 理 


内 存 访问 造成 处 理 器 流水 线 不 能 连续 地 进行 。 所 以 要 尽 可 能 减轻 缺失 对 处 理 硕 流水 线 的 
负面 影响 。 不 能 在 流水 线 的 IF 阶段 隐藏 缺失 ， 但 可 以 在 MEM 阶段 隐藏 (hide) 缺失 。 
。 MEM 阶段 的 读 缺 失 : 考虑 如 下 的 指令 序列 。 


Il: lw ri, a ; Il < 内 存单 元 a 

I2: add r ra, 5S 3 r3 « r4 + r5 

3: nand 26,\ £7, 8 3 r6 + r7 NAND r8 
I4: add r2, 4, E5 3 r2 <— r4 + r5 


I5: add F2 Ti; r2 ? r2 4- ri + x2 


假设 lw 指令 造成 D 缓存 中 的 缺失 -CPU 不 得 不 在 MEM 阶段 等 待 这 条 加 载 (load) 指令 ( 停 
止 先前 阶段 的 工作 ， 并 向 WB 阶段 发 送 空 指令 (NOP))， 直 到 内 存 用 数据 响应 为 止 。 然 而 ， 指 
A> 15 使 用 加 载 到 rl 的 值 。 让 我 们 想 想 如 何 利 用 这 点 信息 阻止 对 拖延 指令 2、HDB A 14 的 执行 
在 第 5 章 中 ， 我 们 给 寄存 器 堆 中 的 寄存 器 引入 忙 厌 位 busy bit) 的 概念 来 处 理 险象 。 对 
于 修改 寄存 器 值 的 指令 ， 在 ID/RR 阶段 将 这 个 位 置 位 〈 见 图 9-15); 当 写 操作 完成 时 ， 清 除 该 
位 。 我 们 可 以 将 这 种 思想 扩展 到 内 存 加 载 中 。 
e MEM 阶段 的 写 缺 失 : 写 缺 失 问 题 的 难度 取决 于 写 策略 和 组 存单 元 分 配 策略 。 首 先 ,我 
们 考虑 采用 直 写 策略 的 情况 。 如 果 缓 存 块 分 配 策略 是 非 写 分 配 ， 那 么 因为 有 写 绥 冲 区 .， 
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成 MEM 阶段 需要 的 操作 。 然 而 ， 如 果 缓 存 块 分 配 策略 是 写 分 配 ， 那 么 这 就 需要 进行 和 
读 缺 失 一 样 的 操作 。 所 以 ， 处 理 器 的 流水 线 在 MEM 阶段 就 会 有 写 延 迟 。 缺 失 的 数据 块 
需要 在 写 操作 完成 前 传人 缓存 ， 尽 管 有 写 缓 冲 区 。 对 于 回 写 策略 ， 因 为 写 缺 失 需 要 像 
读 缺 失 一 样 处 理 ， 所 以 MEM 阶段 的 写 延 迟 是 不 可 避免 的 。 


9.9.1 在 流水 线性 能 上 缓存 缺失 对 内 存 延 迟 的 影响 
让 我 们 重新 考虑 程序 执行 时 间 。 在 第 5 章 中 ， 我 们 将 程序 执行 时 间 定 义 为 : 
执行 时 间 = 执行 的 指令 数目 X CPI X 时 钟 周期 


流水 线 处 理 器 试图 让 CPI,, 等 于 1， 因为 它 尝 试 每 个 周期 处 理 1 条 指令 。 然 而 ， 结 构 、 
数据 和 控制 险象 都 会 对 流水 线 造成 影响 ， 所 以 CPIA,。 的 值 大 于 1。 

分 级 存储 体系 加 剧 了 这 一 问题 。 每 条 指令 都 至 少 要 访问 内 存 一 次 ， 即 读 取 指令 。 另 外 ， 
对 于 内 存 访问 指令 可 能 还 有 额外 的 内 存 访 问 。 如 果 这 些 访问 导致 了 缺失 ， 流 水 线 上 就 会 出 现 
空 指令 。 我 们 将 这 些 由 分 级 存储 体系 造成 的 额外 空 指令 称 为 存储 器 延迟 周期 (memory stall 
cycle). 

这 样 ， 关 于 执行 时 间 我 们 有 了 更 精确 的 描述 : 

执行 时 间 =[ (执行 的 指令 数目 X (CPIA。+ AFER we) 1X 时 钟 周期 (9-3 ) 
我 们 将 处 理 器 的 有 效 CPI 定义 为 : 


有 效 CPI = CPIA,。+ A HEE ave (9-4 ) 
程序 经 历 的 总 内 存 延 迟 定义 为 : 
总 内 存 延 迟 = 指令 的 数目 X AER Avg (9-5) 
每 条 指令 的 平均 内 存 延 迟 数目 定义 为 : 
A FIER ws= 每 条 指令 的 缺失 数目 aX RAMA ag (9-6 ) 


当然 ， 如 果 读 和 写 造 成 不 同 的 缺失 损失 ， 我 们 需要 对 它们 区 别 对 待 〈 见 例 9-3 )。 


有 一 个 流水 线 处 理 器 ， 若 不 考虑 内 存 延 迟 它 的 平均 CPI 值 为 1.8。I 缓存 的 命中 率 为 95%，D 组 
存 的 命中 率 为 98%。 假 设 内 存 访问 指令 占 所 有 执行 指令 的 30%。 这 其 中 ，80% 是 加 载 指 令 ，20% 是 存 
储 指令 。 平 均 来 说 ， 读 缺失 损失 是 20 个 周期 ， 写 缺失 损失 是 5 个 周期 。 考 虑 内 存 延 迟 ， 计 算 处 理 器 的 


有 效 CPI. 
=. 


该 问题 的 解答 使 用 了 前 面 的 式 (9-4) 和 式 (9-6). 
指令 缺失 的 代价 =I 缓存 缺失 率 X 读 缺 失 损 失 
= (1-0.95) 20 
=1 周 期 /指令 
数据 读 缺 失 的 代价 = 程序 中 内 存 访问 指令 的 比例 x 
加 载 的 内 存 访问 指令 的 比例 x 
D 缓存 的 缺失 率 X 读 缺 失 损失 
=0.3x0.8x (1-0.98) x20 
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= 0.096 周期 /指令 
数据 号 缺失 的 代价 = 程序 中 内 存 访 问 指令 的 比例 x 
存储 的 内 存 访问 指令 的 比例 x 
D 缓存 的 缺失 率 X 写 缺失 损失 
= 0.30.2 (1-0.98) x5 
= 0.006 周期 / 指令 
有 效 CPI = 基本 CPI+I 缓存 对 CPI 的 影响 +D 缓存 对 CPU 的 影响 
= 1.8 + 1 + 0.096 + 0.006 


= 2.902 


减少 缺失 率 和 减少 缺失 损失 是 减少 内 存 延 迟 的 关键 ， 从 而 增加 了 流水 线 处 理 器 的 效率 。 
有 两 种 方法 用 于 降低 缺失 率 ， 我 们 将 在 9.10 节 和 9.11 节 中 讨论 它们 。 在 9.12 节 中 ， 我 


们 将 讨论 降低 缺失 损失 的 方法 。 


910 利用 空间 局 部 性 提高 缓存 性 能 


降低 缺失 率 的 第 一 个 方法 利用 空间 局 部 性 原理 。 基 本 想法 是 当 内 存单 元 i 发 生 缺 失 时 将 
相 邻 内 存单 元 中 的 内 容 引 入 缓存 。 因 此 ， 到 目前 为 止 ， 缓存 中 的 每 一 项 都 与 指令 集结 构 中 的 
一 个 内 存 访问 单元 相对 应 。 为 了 利用 缓存 设计 中 的 空间 局 部 性 ， 我 们 通过 内 存 和 缓存 之 间 的 
内 存 传输 单元 的 指令 对 内 存 访 问 单元 进行 去 耦合 。 处 理 器 的 指令 集体 系 结构 决定 了 内 存 访问 
单元 。 例 如 ， 如 果 体 系 结构 的 指令 能 够 按 字 节 寻 址 ， 那 么 处 理 咒 的 内 存 访问 单元 就 是 一 个 字 
节 。 男 一 方面 ， 内 存 传 输 单元 是 分 级 存储 体系 的 设计 参数 。 特 别 地 ， 这 个 参数 总 是 内 存 访问 


单元 的 整数 倍 ， 以 便利 用 空间 局 部 
性 。 我 们 将 缓存 和 内 存 间 的 转换 单元 
称 为 块 大 小 (block size)。 当 遇 到 缺失 
时 ， 缓 存 会 把 包含 缺失 内 存 访 问 的 整 
个 块 大 小 的 块 读 入 内 存 。 

图 9-19 是 这 种 结构 下 内 存 状态 的 
例子 。 在 这 个 例子 中 ， 块 大 小 是 4 个 
字 ， 其 中 一 个 字 是 CPU 指令 内 存 访 
问 单元 。 如 图 所 示 ， 一 个 块 的 内 存 地 
址 从 块 的 边界 开始 。 例 如 ， 如 果 CPU 
缺失 对 内 存单 元 0x01 数据 的 访问 ， 
那么 缓存 会 引入 组 成 块 0 的 4 个 内 存 
字 (从 地 址 0x00 开始 )， 块 0 包含 单 
元 0x01. 

连续 的 字 组 成 块 ， 块 组 成 缓存 中 
的 项 , CPU 产生 的 地 址 有 如 下 3 部 分 : 
标记 位 、 索 引 和 块 偏 移 量 ， 如 图 9-20 
所 示 。 

注意 块 偏 移 量 是 模拟 包含 多 个 连 
续 内 存单 元 的 缓存 块 所 需要 的 位 数 。 





图 9-19 ” 当 遇 到 缺失 时 ， 主 存 按 块 进行 了 划分 ,这些 块 的 
位 置 是 连续 的 ， 以 便 使 内 存 和 缓存 进行 信息 传递 
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例如 ， 如 果 块 大 小 是 64 字 节 ， 那 么 块 偏 移 量 是 6 位。 给 定 块 的 所 有 数据 都 包含 在 一 个 缓存 项 中 。 
标记 和 有 索引 字段 的 意义 与 前 面 一 样 。 下 面 介绍 图 9-20 中 不 同 字 段 所 需 位 数 的 通用 计算 方法 。 


缓存 索引 块 偏 移 量 


n b 


图 9-20 ”对 CPU 产生 的 包含 多 个 字 的 缓存 块 的 内 存 地 址 进行 翻译 





缓存 标记 位 


tg 




















设 & 表 示 内 存 地 址 的 位 数 ，$ 是 缓存 按 字 节 计 算 的 总 大 小 ，B 是 块 大 小 。 
图 9-20 中 不 同 字 有 段 的 计算 表达 式 如 下 : 


b = log,B (9-7) 
L = S/B ( 9-8 ) 
n = log,L (9-9 ) 
t=a(b+n) (9-10) 


L xe PERN FE PAT, REFERA S, BERRY B FT, K 9-20 中 4b 是 内 存 地 
址 的 最 低 有 效 位 ; 上 是 内 存 地 址 的 最 高 有 效 位 , 是 内 存 地 址 的 中 间 位 ( 见 例 9-4 关于 这 些 字 
段 的 计算 )。 

现在 我 们 在 多 字 字 块 大 小 的 环境 中 重新 回顾 基本 的 缓存 算法 (ER, AS), B 9-21 显 
示 了 下 接 映 射 缓存 的 结构 。 


内 存 地 址 





ait 传送 给 CPU 的 数据 


图 9-21 ”一 个 多 字 直 接 映射 缓存 的 结构 。 利 用 多 路 复 用 右 ， 块 偶 移 量 从 选 定 的 块 中 选择 
特定 的 字 发 送 给 CPU。 水 平 阴 影 部 分 的 块 是 缓 仔 索 引 选 择 的 块 


1) BH: 如 图 9-20 所 示 ， 内 存 地 址 的 中 间 部 分 用 于 缓存 查找 。 缓 存 项 包含 一 个 整 块 (如 
果 地 址 中 的 缓存 标记 和 特定 项 中 的 标记 确定 它 命 中 )。 地 址 的 最 低位 确定 处 理 器 请 求 的 块 中 
的 特定 字 (或 字 节 )。 多 路 复 用 器 利用 这 4b 位 从 块 中 选择 特定 的 字 (或 字 节 )， 并 将 它 发 送 给 
CPU ( 见 图 9-21 )。 

2 ) 读 : 当 读 时 ,缓存 取出 对 应 于 缓存 索引 的 整个 块 。 如 果 标 记 位 的 比较 结果 是 命中 ， 那 
么 多 路 复 用 器 选择 块 中 的 特定 字 (或 字 节 )， 并 将 它 发 送 给 CPU。 如 果 是 缺失 ，CPU 启动 内 存 
的 一 个 块 传送 。 


cS s 


3) 5: 我 们 不 得 不 修改 写 算法 ， 因 为 对 于 整个 的 缓存 行 只 有 一 个 有 效 位 。 与 读 缺 失 类 似 ， 
当 遇 到 写 缺 失 时 ，CPU 启动 内 存 的 一 个 块 传送 ( 见 图 9-22 ) 。 






CPU 要 写 人 缓存 
的 数据 
从 内 存 读 取 的 数 
JEER 


图 9-22 处理 写 缺失 时 CPU 、 缓 存 和 内 存 之 间 的 交互 。 缺 失 的 块 首先 从 内 存 传送 到 缓存 ， re 
然后 CPU 要 写 人 的 特定 单元 在 缓冲 块 中 进行 更 新 380 


当 命中 时 ，CPU 将 特定 的 字 (或 字 节 ) 写 信 缓存。 根据 写 策 略 ， 实 现 会 要 求 额 外 的 元 数 
据 (以 脏 位 的 形式 )， 并 可 能 采取 额外 的 措施 (例如 ， 将 修改 的 字 或 字 节 写 入 内 存 ) 来 完成 写 
操作 ( 见 例 9-4 )。 


考虑 一 个 64KB 的 多 字 直 接 映 射 缓存 。CPU 生成 32 位 按 字 节 寻 址 的 内 存 地 址 。 每 个 内 存 字 包 
含 4 字 节 。 块 大 小 是 16 字 节 。 缓 存 使 用 每 个 字 有 一 个 脏 位 的 回 写 策略 。 缓 存 对 于 每 个 数据 块 有 一 个 有 
效 位 。 

a. CPU 如 何 翻 译 内 存 地 址 ? 


答 : 
参考 式 (9-7), 
块 大 小 
B=16 字 节 ; 
所 以 
b= log,16 = 4 ft 


我 们 需要 4 位 (内 存 地 址 的 位 0 ~ 3) 用 于 处 理 块 偏 移 量 。 
BAEK (7-8 )， 缓 存 行 的 数目 为 


L = 64KB/16 字 节 = 4096 
参考 式 (7-9 )， 索 引 位 的 数目 
n = log} = log,4096 = 12 
参考 式 (7-10 )， 标 记 位 的 数目 
t=a(n+ b)= 3212 + 4)= 16 


mo, 我们 需要 12 位 (内 存 地 址 中 的 位 4 ~ 15) 用 作 索 引 。 剩 下 的 16 位 (内 存 地 址 的 位 
16 ~ 31) 用 作 标 记 。 下 图 显示 了 CPU 对 内 存 地 址 的 翻译 : 381 
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1 字 节 
命中 发 送 给 CPU 的 数据 
b. 计算 实现 缓存 所 需 的 总 的 存储 大 小 ( 即 实 际 数据 加 上 元 数据 )。 
答 : 
每 个 缓存 行 有 : 
数据 16 字 节 X8 位 / 字 节 =128 位 
有 效 位 1 位 
脏 位 4 位 (每 字 有 1 位 ) 
标记 16 位 
149 位 


缓存 的 总 空间 =149 x 4096 缓存 行 =610 304 位 
元 数据 需要 的 空间 = 总 空间 一 实际 数据 
= 610 304 — 64KB 
= 610 304 — 524 288 
= 86 016 
空间 开销 = 元 数据 /总 空间 = 86 016/610 304 = 14% 
回想 一 下 ， 例 9-2 使 用 4 字 节 的 块 ， 对 于 同样 大 小 的 缓存 ， 空 间 开 销 是 35%。 换 句 话说 ， 增 加 
块 的 大 小 能 够 降低 元 数据 的 需求 ， 因 此 也 减少 了 空间 开销 。 


9.10.1 增加 块 大 小 对 性 能 的 影响 


理解 增加 块 大 小 对 缓存 性 能 的 影响 很 有 指导 性 。 增 加 块 大 小 主要 是 利用 了 空间 局 部 性 原 
理 。 所 以 ， 对 于 给 定 总 容量 的 缓存 ， 我 们 希望 通过 增加 块 大 小 来 降低 缺失 率 。 在 极限 条 件 下 ， 
我 们 可 以 仅 用 一 个 缓存 块 (缓存 块 的 大 小 为 缓存 的 总 容量 )。 因 此 ， 关 于 块 大 小 ， 有 如 下 两 个 
问题 : 

1 ) 缺失 率 总 是 能 够 下 降 吗 ? 

2) 当 我 们 增加 块 大 小 时 ， 处 理 器 的 性 能 总 能 提升 吗 ? 

对 于 第 一 个 问题 ， 答 案 是 不 是 的 。 实 际 上 ， 当 缺失 率 下 降 达 到 某 个 拐点 后 会 开始 上 升 。 
我 们 在 第 8 章 中 讲 的 工作 集 概念 是 这 一 现象 的 原因 。 回 想 一 下 ， 程 序 的 工作 集 总 是 随时 间 不 
断 变化 。 缓 存 块 包含 连续 的 内 存 地 址 。 然 而 ， 如 果 程 序 的 工作 集 发 生 了 变化 ， 那 么 大 的 块 下 
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寸 也 会 增加 缺失 率 ( 见 图 9-23 )。 


缺失 率 





拐点 块 大 小 


图 9-23 缺失 率 随 块 大 小 变化 的 曲线 。 当 增加 块 大 小 时 缺失 率 会 降低 ， 但 对 于 一 个 特定 
大 小 的 缓存 ， 我 们 会 达到 一 个 拐点 ， 在 拐点 之 后 缺失 率 会 上 升 


对 于 第 二 个 问题 ， 答 案 有 点 儿 复 杂 。 如 图 9-23 所 示 ， 对 于 给 定 的 缓存 大 小 ， 在 达到 拐点 
前 缺失 率 确 实 随 着 块 大 小 的 增加 而 下 降 。 这 可 以 让 处 理 器 有 更 少 的 内 存 延 迟 ， 并 提高 性 能 。 
然而 ， 当 块 大 小 超过 拐点 后 ， 处 理 需 会 有 更 多 的 内 存 延 迟 ， 并 且 性 能 会 降低 。 处 理 需 性 能 的 
衰退 可 能 出 现在 比 图 9-23 中 扮 点 位 置 更 早 的 时 间 。 虽 然 对 于 给 定 的 缓存 大 小 ， 缺 失 率 在 达到 
拐点 前 随 着 块 大 小 的 增加 而 降低 ， 但 是 增加 的 块 大 小 可 能 会 对 降低 缺失 损失 带 来 负面 效应 。 
减少 程序 的 执行 时 间 是 主要 的 目标 ， 这 一 目标 主要 是 靠 减少 分 级 存储 体系 中 流水 线 的 延迟 来 
实现 。 块 大 小 越 大 ， 当 遇 到 缺失 时 花费 在 从 内 存 将 数据 传送 到 缓存 的 时 间 开 销 也 越 大 ， 这 样 
也 增加 了 内 存 延 迟 。 我 们 将 简要 讨论 降低 缺失 损失 的 技术 。 需 要 注意 的 是 ， 由 于 设计 参数 
( 块 大 小 和 缺失 损失 ) 是 相互 关联 的 ， 所 以 对 一 个 参数 进行 优化 并 不 总 能 使 整体 性 能 得 到 提升 。 
换 名 话说， 仅仅 着 眼 于 缺失 率 ， 并 把 它 作为 性 能 优化 的 斥 度 可 能 会 造成 缓存 设计 上 的 错误 。 

在 流水 线 处 理 器 设计 中 (第 $ 章 )， 我 们 理解 了 单 指令 延迟 和 处 理 器 整体 吞吐 量 之 间 的 区 
别 。 类 似 地 ， 在 缓存 设计 中 ， 利 用 空间 局 部 性 原理 可 以 降低 后 面 指令 的 潜在 缺失 ， 而 块 大 小 \ 
的 选择 会 影响 单 指令 的 延迟 (导致 缺失 ) 和 程序 整体 吞吐 量 之 间 的 平衡 。 现 实 中 的 一 个 例子 是 
所 得 税 。 每 个 人 要 交 税 (类 似 延 迟 )， 交 税 减少 了 个 人 的 财富 ， 但 有 助 于 社会 整体 的 建设 (类 
似 吞吐 量 )。 当 然 ， 平 衡 好 这 两 者 的 关系 最 好 。 平 衡 点 的 位 置 取决 于 所 采用 的 策略 方法 。 

现代 处 理 器 对 于 这 些 问 题 有 了 更 复杂 的 处 理 方法 。 处 理 顺 的 微 体 系 结构 ， 即 ISA 的 实现 
细节 ， 是 非常 复杂 同时 引人入胜 的 。 只 要 保持 程序 的 语义 ， 指 令 就 没 必 要 按照 程序 的 顺序 执 
行 。 缓 存 缺 失 不 一 定 会 阻碍 处 理 器 的 运行 ， 这 种 缓存 称 为 非 锁定 缓存 (lock-up free cache). 
这 些 和 其 他 微观 级 优化 以 无 法 预测 的 方式 彼此 相互 作 有 用， 当然， 它们 对 处 理 右 上 的 工作 负载 
也 很 敏感 。 简 单 地 说 ， 当 把 缓存 块 的 大 小 变 为 原来 的 两 倍 时 ， 需 要 装 人 内 存 的 数据 也 会 变 为 
原来 的 两 倍 。 内 存 系统 通常 跟 不 上 这 种 需求 。 结 果 是 在 图 9-23 的 平衡 点 之 前 性 能 下 降 了 。 


9.11 灵活 的 布局 策略 


在 直接 映射 缓存 中 ， 内 存 地 址 和 缓存 索引 之 间 有 一 对 一 的 映射 关系 。 因 为 这 种 严格 的 映 
射 ， 缓 存 不 能 将 新 的 内 存单 元 放 在 缓存 当前 未 占用 的 单元 中 。 由 于 程序 的 自身 特性 ， 这 种 严 
格 的 对 应 关系 降低 了 性 能 。 图 9-24 说 明了 直接 映射 缓存 随 着 程序 工作 集 的 改变 而 表现 得 很 没 
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有 效率 。 





”程序 的 内 存 印记 
图 9-24 程序 的 不 同 工 作 集 占用 直接 映射 缓存 的 相同 部 分 


在 程序 执行 的 过 程 中 ， 程 序 频繁 地 在 3 个 工作 集 ( WS1、WS2 和 WS3 ) 之 间 跳 转 ， 这 3 
个 工作 集 恰 巧 映 射 为 图 中 的 同一 缓存 区 域 。 假 设 每 个 工作 集 都 是 缓存 总 大 小 的 13。 所 以 ， 原 
则 上 说 ， 缓 存 内 有 足够 的 空间 加 载 全 部 3 个 工作 集 。 但 由 于 是 严格 的 映射 ， 绥 存 中 的 工作 集 
是 一 个 一 个 地 进行 奉 换 ， 导 致 性 能 较 低 。 理 想 情 况 下 ， 我 们 乔 望 程序 的 全 部 3 个 工作 集 能 够 
驻 留 在 缓存 中 ， 这 样 除 了 必要 的 一 个 外 就 不 会 有 缺失 -。 

让 我 们 来 讨论 如 何 实现 这 一 目标 。 缓 存 的 设计 应 该 考虑 程序 的 局 部 性 会 随时 间 改 变 。 我 
们 将 首先 讨论 一 种 完全 可 以 避免 这 种 错误 的 极其 灵活 的 替换 策略 。 


9.11.1 全 相关 缓存 


在 这 种 设置 中 ， 没 有 从 内 存 块 到 组 
放 在 任意 内 存 块 中 。 所 以 ， 这 种 结构 下 | 
的 缺失 只 有 强制 缺失 和 容量 缺失 。 缓 存 a een 
翻译 CPU 给 出 的 内 存 地 址 ， 如 图 9-25 所 示 。 注 意 翻 译 中 没有 缓存 索引 。 

这 是 由 于 ， 如 果 没 有 唯一 映射 关系 ,那么 内 存 块 可 以 驻 留 在 任何 缓存 块 中 。 因 此 ， 在 这 
种 结构 下 ,为 了 查找 ,缓存 需要 搜索 所 有 项 来 查看 内 存 地 址 中 的 缓存 标记 和 任何 有 效 项 的 标 
记 位 是 否 匹 配 。 一 种 可 能 的 策略 是 连续 地 搜索 每 个 缓存 项 。 从 处 理 需 性 能 的 角度 看 ， 这 是 站 
不 住 脚 的 。 所 以 ， 硬 件 为 每 一 项 增加 一 个 重复 的 比较 器 ， 这 样 可 以 并 行 地 对 所 有 的 标记 位 进 
行 比 较 来 查看 是 否 命 中 ( 见 图 9-26 )。 
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内 存 地 址 V 标记 数据 V 标记 数据 V 标记 数据 
缓存 标记 





图 9-26 全 相关 缓存 的 并 行 标记 匹配 人 硬件。 缓存 的 每 块 代表 一 个 独立 的 缓存 。 标 记 匹 配 需 
要 对 所 有 缓存 是 否 命中 并 行 执 行 。 这 样 ， 给 定 的 内 存 块 可 以 放 在 任何 一 个 缓存 块 
中 (图 中 阴影 部 分 )。 当 命中 时 ， 与 内 存 地 址 成 功 匹 配 的 块 将 数据 传送 给 CPU 


匹配 硬件 的 并 行 标记 的 复杂 性 使 全 相关 缓存 不 适用 于 任何 合理 大 小 的 缓存 。 乍 一 看 ， 由 
于 它 的 灵活 性 ， 对 于 给 定 的 工作 负载 和 缓存 大 小 ， 全 相关 缓存 似乎 可 以 更 好 地 降低 缺失 率 ， 
但 事实 并 不 是 这 样 的 。 缓 存 ， 作 为 一 种 宝贵 的 高 速 资源 ， 大 多 数 情 况 下 的 利用 率 接近 饱和 。 
这 样 ， 缓 存 中 的 缺失 不 可 避免 地 导致 将 缓存 中 一 些 已 有 的 东西 蔡 换 出 去 。 如 何 选择 被 替换 项 
对 缓存 缺失 率 有 巨大 的 影响 〈 因 为 我 们 不 知道 未 来 CPU 会 访问 哪些 内 存 地 址 )， 也 会 对 被 替换 
的 全 相关 缓存 中 缺失 行 的 灵活 性 产生 不 利 影响 。 我 们 在 后 面 会 简要 地 讨论 缓存 蔡 换 策略 的 细 
节 ( 见 9.14 节 )。 可 以 肯定 地 说 ， 在 这 一 点 上 ， 由 于 上 述 原因 ， 除 非 在 非常 特殊 的 环境 中 ， 我 
们 很 少 在 实际 中 使 用 全 相关 缓存 。 第 8 章 讲 的 劳 路 转换 缓冲 器 (TLB) 由 于 容量 较 小 ， 是 全 相 
关 的 结构 。 全 相关 的 名 字 来 源 于 内 存 块 可 以 和 任何 一 个 缓存 块 相关 联 。 


911.2 ”组 相关 缓存 


组 相关 缓存 是 直接 映射 和 全 相关 的 折 中 。 这 种 结构 的 名 字 来 源 于 一 个 内 存 块 可 以 与 一 
组 缓存 块 相 关联 。 例 如 ，2 路 组 相关 缓存 给 缓存 中 的 每 个 内 存 块 2 个 可 能 存放 的 位 置 。 类 
似 地 ，4 路 组 相关 缓存 给 缓存 中 的 每 个 内 存 块 4 个 可 能 的 存放 人 位置。 相关 程 度 (degree of 
associativity) 定义 为 给 定 内 存 块 在 缓存 中 拥有 的 存放 位 置 数 。 2 路 组 相关 缓存 的 相关 程度 是 2, 
4 路 组 相关 缓存 的 相关 程度 是 4， 以 此 类 推 。 

关于 组 相关 缓存 ， 一 种 简单 的 理解 方式 是 将 它 想 象 成 多 个 直接 映射 缓存 。 为 了 使 讨论 更 
具体 ， 考 虑 一 个 16 个 数据 块 的 缓存 。 我 们 可 以 将 这 16 个 数据 块 组织 成 直接 映射 缓存 ( 见 图 
9-27a)， 也 可 以 组 织 成 2 路 组 相关 缓存 ( 见 图 9-27b), 或 者 4 路 组 相关 缓存 ( 见 图 9-27c)。 当 
然 ， 每 个 数据 块 都 有 相关 的 元 数据 。 

在 直接 映射 缓存 中 ， 给 定 索 引 (03), 缓存 中 就 会 有 一 个 位 置 对 应 于 该 索引 值 。2 路 组 
相关 缓存 在 缓存 中 有 两 个 位 置 (图 9-27b 中 的 阴影 ) 对 应 于 同一 个 索引 。4 路 组 相关 缓存 有 4 
个 位 置 ( 见 图 9-27c 中 的 阴影 ) 对 应 于 同一 个 索引 。 对 于 16 个 数据 块 的 缓存 ， 第 一 种 结构 需 
要 4 位 的 索引 来 对 缓存 进行 查找 ， 而 第 二 种 结构 需要 3 位 的 索引 ， 第 三 种 需要 2 位 。 给 定 一 
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个 内 存 地 址 ， 缓 存 同时 查找 所 有 可 能 的 位 置 ， 也 就 是 与 地 址 中 索引 值 相 匹配 的 组 。 组 相关 组 
存 所 需要 的 标记 匹配 硬件 的 数目 等 于 相关 程度 。 


有 效 位 标记 数据 有效 位 标记 “数据 ” 有效 位 标记 数据 


Cd 
1 
2 
3 
4 
5 
6 
7 


b) 2 路 组 相关 缓存 





a) 直接 映射 缓存 


有 效 位 标记 数据 ”有效 位 标记 数据 “有效 位 标记 数据 有效 位 标记 数据 


上 二 


c) 4 路 组 相关 缓存 


图 9-27 16 个 缓存 数据 块 的 3 种 不 同 结 构 。 根 据 相关 程度 不 同 ， 给 定 的 内 存 块 可 以 存 
放 在 不 同 的 缓存 块 中 。 上 面 的 3 个 图 中 的 阴影 部 分 表示 给 定 内 存 块 所 能 存放 
的 位 置 





图 9-28 是 块 大 小 为 4 字 节 的 4 路 组 相关 缓存 的 完整 结构 。 

缓存 将 从 CPU 得 到 的 内 存 地 址 转换 成 标记 、 索 引 和 块 偏 移 量 ， 类 似 于 直接 映射 的 结构 
( 见 图 9-29 ) 。 

让 我 们 来 讨论 在 缓存 查找 中 如 何 将 内 存 地 址 分 解 为 索引 和 标记 位 。 对 于 直接 映射 结构 ， 
缓存 的 总 大 小 决定 了 索引 位 的 数量 ， 即 log;(S/8)，S 是 缓存 大 小 , BERK, MUP TH 
单位 。 对 于 总 缓存 大 小 相同 的 组 相关 缓存 ， 索 引 位 的 位 数 为 log:(S/pB), p 是 相关 联 程度 。 
例如 ， 对 于 总 缓存 大 小 为 16 个 数据 块 的 4 路 组 相关 缓存 ， 要 求 的 位 数 为 log:(16/4)=2 位 

见 图 9-27c ) 。 
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标记 “| RI | 寸 -一 字 节 偏 移 量 (2 位 ) 
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图 9-29 翻译 CPU 产生 的 内 存 地 址 对 组 相关 缓存 和 直接 映射 缓存 没有 区 别 


9.11.3 ”组 相关 的 极端 情况 


直接 映射 和 全 相关 缓存 都 是 组 相关 缓存 的 特殊 情况 。 考 虑 缓存 的 总 大 小 为 S$ 字 市 ， 块 大 
小 为 B 字 节 ， 缓 存 中 数据 块 的 数目 为 N， 则 N=S/B。 我 们 将 这 些 数据 块 组 织 成 p 个 并 行 缓 存 ， 
A p 路 组 相关 缓存 。 缓 存 有 Nip 个 缓存 行 (或 称 为 组 9S)， 每 个 缓存 行 有 pp 个 数据 块 。 缓 存 
需要 p 个 并 行 硬件 用 于 标记 比较 。 

如 果 p = 1 会 是 什么 情况 ? 在 这 种 情况 下 ， 结 构 变 为 直接 映射 缓存 ， 缓 存 有 N 个 缓存 行 ， 
每 个 组 有 1 块 。 

如 果 p = N 会 发 生 什 么 呢 ? 这 种 情况 下 ， 结 构 会 变 为 全 相关 缓存 ， 缓 存 只 有 1 个 有 NN 块 
的 缓存 行 。 


怠 “ 所 以 目前 为 止 我 们 有 4 个 术语 指 的 是 同一 件 事 : 缓存 行 (cache line), RAR (cache block)、 缓 存 项 (cache 
entry) 和 组 (set). 
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有 了 以 上 讨论 ， 我们 重新 来 看 式 (9-7) ~ 式 (9-10): 


总 


缓存 大 小 =S FH 


块 大 小 =B FY 


内 


存 地 址 =a 位 


相关 程度 =p 
缓存 中 的 总 数据 块 数 为 


N = S/B 


我 们 将 计算 缓存 行 的 式 ( 9-8 ) H FARHA: 


L = S/pB = N/p 


B 


( 9-11 ) 


(9-12 ) 


式 (9-8) 是 当 p=1 时 式 (9-12) 的 特殊 情况 。 索 引 位 的 数目 n 由 式 logyL 得 到 ( 见 式 (9-9 ) )。 
正如 前 文 所 说 ， 全 相关 缓存 主要 用 于 TLB。 相 关 程 度 通 常 由 分 级 存储 体系 中 的 缓存 级 别 
决定 。 直 接 映 射 缓存 或 2 路 组 相关 缓存 是 L1 级 缓存 ( 离 CPU 较 近 ) 的 典型 应 用 。 更 深层 的 


分 级 存储 体系 也 会 有 更 高 的 相关 程度 。 我 们 在 9.19 区 会 重新 来 看 看 这 些 问题 。 


考虑 一 个 数据 大 小 为 64KB 的 4 路 组 相关 缓存 。CPU 生成 32 位 按 字 节 寻 址 的 内 存 地 址 。 每 个 


内 存 字 包含 4 字 节 。 块 大 小 是 16 字 节 。 人 缓存 采取 直 写 策略 。 每 个 数据 块 有 一 个 有 效 位 。 


答 


a. CPU 如 何 翻译 内 存 地 址 ? 
b. 计算 实现 缓存 的 总 的 存储 大 小 ( 即 实际 数据 加 上 元 数据 )。 


a. 内 存 地 址 的 位 数 
a=32 位 
因为 块 大 小 是 16 字 节 ， 所 以 使 用 式 (9-7), RB E 
b=4 位 (内 存 地 址 中 的 位 0 ~ 3) 
因为 是 4 路 组 相关 缓存 ( 见 图 9-27c)， 


Y 
I 
上 


缓存 行 的 数目 ( 见 式 (9-12 )) 
L = S/Pb = 64KB/(4 X 16) 字 节 =1K 
索引 位 的 数目 ( 见 式 (9-9 )) 
n = log,L = log,1024 = 10 位 
标记 位 的 数目 ( 见 式 (9-10 )) 
t=a_(n+b)=32-(10+4)=18 位 


所 以 ， 内 存 地 址 最 高 位 为 31， 最 低位 为 0， 则 
标记 位 18 {1 (31 ~ 14) 
索引 位 10 位 (13 ~ 4) 
块 偏 移 量 4 位 (3~0) 


b. 4 个 并 行 缓存 的 每 一 个 中 的 块 (数据 加 元 数据 ) 包含 : 


数据 : 16X8 位 =128 位 (每 个 缓存 块 有 16 位 ) 
有 效 位 =] 位 (每 块 有 1 位 ) 


ARMAMENT 


标记 =18 位 


总 位 数 =147 位 
每 个 缓存 行 有 4 个 这 样 的 块 =147 X 4=588 位 。 
在 整个 缓存 中 有 1K 个 这 样 的 缓存 行 ， 缓 存 的 总 大 小 = 
588 位 /缓存 行 X1024 缓存 行 = 602 112 位 


考虑 一 个 4 路 组 相关 缓存 。 
© 缓存 的 总 数据 大 小 =256KB. 
© CPU 生成 32 位 按 字 节 和 寻 址 的 内 存 地 址 。 
。 每 个 内 存 字 由 4 STAR. 
© 缓存 块 的 大 小 为 32 字 节 。 
。 每 个 缓存 行 有 一 个 有 效 位 。 
。 缓存 采取 回 写 策略 ， 每 字 有 一 个 脏 位 。 
a. CPU 如 何 翻译 内 存 地 址 。( 哪 些 位 用 作 缓 存 索 引 ， 哪 些 位 用 作 标 记 ， 哪 些 位 用 作 块 偏 移 量 ? ) 
b. 计算 缓存 的 总 大 小 ( 即 数据 加 上 元 数据 )。 
答 : 
a. 和 例 9-5 类 似 ， 
标记 16 位 (31 ~ 16) 
索引 11 位 (15~5) 
块 偏 移 量 5 位 (0~4) 
b. 四 个 并 行 缓存 中 的 块 包 含 如 下 : 
数据 : 32X8 位 ”=256 位 (每 个 缓存 块 32 字 节 ) 


有 效 位 : =] 位 〈 每 块 有 1 个 有 效 位 ) 
脏 位 : 8X1 位 =8 位 (每 字 有 1 个 脏 位 ) 
标记 =16 位 

总 位 数 =281 位 


每 个 缓存 行 包 含 4 个 这 样 的 块 =281 X 4=1124 位 。 
整个 缓存 中 有 2K 个 这 样 的 缓存 行 ， 缓 存 的 总 大 小 = 
1124 位 /缓存 行 X2048 缓存 行 =281KB 


912 ”指令 和 数据 缓存 


在 处 理 器 流水 线 中 ( 见 图 9-15 )， 我 们 介绍 了 两 个 缓存 : 一 个 在 IF 阶段 ， 一 个 在 MEM 阶 
段 。 表 面 上 看 ， 前 一 个 用 于 处 理 指令 ， 后 一 个 用 于 处 理 数 据 。 有 些 程序 可 能 需要 大 的 指令 组 
存 ， 而 另 一 些 程序 可 能 需要 大 的 数据 缓存 。 

我 们 很 想 把 这 两 个 缓存 合并 为 一 个 大 的 、 统 一 的 缓存 。 当 然 ， 对 于 给 定 大 小 的 缓存 ， 当 
不 考虑 是 数据 还 是 指令 模式 的 访问 时 会 增加 命中 率 。 

然而 ， 合 并 也 有 一 个 缺点 。 我 们 知道 F 阶段 在 每 个 时 钟 周期 都 要 访问 工 缓存 ， 而 D 缓存 
只 对 内 存 访问 指令 时 (加 载 /存储 ) 起 作用 。 采 用 统一 的 缓存 可 能 会 导致 结构 上 的 险象 并 降低 
流水 线 的 性 能 。 实 证 研究 说 明 统 一 的 缓存 产生 的 结构 上 的 险象 所 带 来 的 不 利 影响 降低 了 整个 
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流水 线 的 性 能 ， 尽 管 提高 了 命中 率 。 

有 一 些 刹 件 技术 (例如 ， 多 个 读 端口 的 缓存 ) 用 于 避 开 将 1 缓存 和 D 缓存 合并 所 带 来 的 
不 利 影响 。 然 而 ， 这 些 技术 增加 了 处 理 需 的 复杂 性 ， 这 反 过 来 会 影响 流水 线 的 时 钟 周期 。 回 
想 一 下 ， 绥 存 是 为 了 缓解 访问 速度 和 缺失 率 之 间 的 关系 而 产生 的 。 正 如 我 们 在 开始 所 提 及 的 
( 见 9.4 45), LI 缓存 设 计 的 主要 目的 是 为 了 将 命中 时 间 与 处 理 器 时 钟 周 期 相 匹 配 。 这 表明 避 
FL 缓存 不 必要 的 设计 复杂 性 是 为 了 保持 较 低 的 命中 时 间 。 另 外 ， 由 于 对 指令 和 数据 的 访问 
方式 不 同 ， 所 以 1 缓存 和 DD 缓存 在 设计 上 考虑 的 因素 (如 相关 程度 ) 也 不 一 样 。 除 此 之 外 ， 由 

心 片 密度 的 提高 ， 现 在 可 以 设计 独立 的 有 足够 空间 的 1 缓存 和 DD 缓存 来 弥补 将 缓存 分 开 所 
带 来 的 缺失 率 的 开销 。 最 后 ，I 缓存 不 用 支持 写 操作 ， 这 会 让 I 缓存 更 简单 、 速 度 更 快 。 由 于 
这 些 原 因 ， 通 常 尺 片上 的 1 缓存 和 DD 缓存 是 分 开 的 。 然 而 ， 由 于 L2 缓存 设计 的 主要 目的 是 降 
低 缺 失 率 ， 所 以 通常 会 有 一 个 统一 的 L2 BF. 


9.13 ”降低 缺失 损失 


缺失 损失 是 当 发 生 缺 失 时 数据 从 内 存 传输 到 缓存 的 服务 时 间 。 正 如 我 们 前 面 所 观察 到 的 ， 
读 操 作 和 写 操作 损失 是 不 一 样 的 ， 并 且 损 失 由 数据 通路 上 的 其 他 硬件 确定 ,例如 写 缓冲 区 ， 
允许 与 内 存 传输 时 同时 进行 计算 的 写 缓冲 区 。 

通常 ， 主 存 系统 的 设计 都 要 考虑 缓存 的 结构 。 特 别 是 ， 要 支持 问 /从 CPU 填充 缓存 的 块 
传输 。 连 接 主 存 和 CPU 的 内 存 总 线 在 确定 缺失 损失 方面 起 着 关键 作用 。 处 理 器 和 内 存 之 间 每 
次 数据 传输 所 需要 的 时 间 ， 称 为 总 线 周期 时 间 。 处 理 器 和 内 存 之 间 每 个 时 钟 周期 传输 的 数据 
量 称 为 内 存 带 宽 (memory bandwidth )。 内 存 带 宽 用 于 度量 处 理 需 和 内 存 之 间 传 递 信 息 的 吞吐 
量 。 带 宽 由 处 理 器 和 内 存 之 间 的 数据 线 的 数目 决定 。 根 据 总 线 的 位 宽 限 制 ， 内 存 系统 可 能 需 
要 多 个 总 线 周 期 来 传递 一 个 缓存 块 。 人 例如， 如果 块 大 小 是 4 个 字 ， 内 存 总 线 位 宽 只 有 一 个 字 ， 
那么 需要 4 个 总 线 周期 来 完成 块 传输 。 作 为 一 阶 近似 ， 我 们 可 以 将 缺失 损失 定义 为 从 内 存 传 
俞 一 个 缓存 块 到 缓存 的 总 时 间 (用 CPU 时 钟 周 期 度量 )。 然 而 ， 对 于 一 个 单独 的 缺失 ， 处 理 
器 所 经 历 的 实际 延迟 可 能 比 块 传输 时 间 短 。 这 是 因为 内 存 系统 可 以 先 为 处 理 器 访 存 缺失 提供 
特定 的 数据 ， 再 传输 包含 缺失 访问 的 内 存 块 的 余下 部 分 。 

尽管 在 内 存 系统 中 支持 这 样 的 块 传输 ， 但 当 块 大 小 超过 一 定 值 时 会 有 其 他 不 利 影响 。 例 
如 ， 如 果 处 理 器 在 单元 x 处 发 生 读 缺失 ， 组 存 子 系统 读 和 人 包含 x 的 整个 块 ， 那 么 可 能 首先 让 
处 理 器 服务 x。. 根 据 处 理 器 和 内 存 之 间 带 宽 的 不 同 ， 在 接 下 来 内 存 系 统 可 能 会 花费 多 个 总 线 
周期 来 传输 块 的 其 他 部 分 。 同 时 ， 处 理 器 可 能 会 在 不 同 缓存 块 的 另 一 个 内 存单 元 7 引入 第 二 
个 缺失 。 现 在 ， 因 为 系统 忙于 完成 在 x 上 发 生 缺 失 时 的 块 传输 ， 所 以 内 存 系统 不 能 立即 处 理 
第 二 个 缺失 。 这 就 是 我 们 在 9.10 节 观 察 到 的 ， 不 能 只 将 缺失 率 作 为 设计 缓存 块 大 小 的 参考 指 
标的 原因 。 这 是 每 个 计算 机 子 系统 设计 时 都 会 遇 到 的 关于 延迟 和 吞吐 量 之 间 关 系 的 经 典 问题 。 
我 们 在 第 5 章 介 绍 了 这 一 内 容 ， 现 在 我 们 在 内 存 系统 中 来 看 看 这 部 分 内 容 ， 在 第 13 章 我 们 将 
从 网 络 的 角度 重新 审视 这 部 分 内 容 。 


9.14 ”缓存 替换 策略 


在 直接 映射 缓存 中 ， 替 换 策略 提前 确定 了 被 蔡 换 项 。 因 此 ， 这 是 没有 办 法 选择 的 。 
在 组 相关 或 全 相关 缓存 中 ， 可 以 选择 被 替换 的 项 。 利 用 时 间 局 部 性 原理 ,我们 建议 采用 
LRU 策略 。 对 于 全 相关 缓存 ， 缓 存 对 所 有 的 块 用 LRU 策略 选择 被 蔡 换 项 。 对 于 组 相关 缓存 ， 


2 


选 作 被 蔡 换 的 项 局 限于 能 够 加 载 当 前 缺失 内 存 访问 的 组 。 
为 了 记录 LRU 信息 ,缓存 需要 额外 的 元 数据 。 图 9-30 显示 了 记录 2 路 组 相关 缓存 的 
LRU 信息 的 硬件 结构 。 每 组 (或 缓存 行 ) 都 有 一 个 与 它 相 关 的 LRU 位 。 


有 效 位 my 数据 “有 效 位 标 数据 LRY 


HE 


图 9-30 在 2 路 组 相关 缓存 中 每 组 有 1 位 LRU。 对 于 给 定 的 行 ， 相 关 的 LRU 位 说 明 哪 个 
缓存 (CO 或 C1 ) 最 近 被 访问 


N Oo ao A OO YO 一 


对 于 每 次 访问 ， 硬 件 都 对 当前 访问 的 内 存 块 所 在 组 的 LRU 位 进行 设置 。 假 设 对 于 给 定 组 
的 两 个 块 都 有 有 效 位 ， 那 么 硬件 根据 缓存 C0 还 是 Cl 中 的 访问 命中 来 设置 LRU 位 为 0 或 1。 
如 果 LRU 位 为 1， 则 蔡 换 C0 中 的 块 ; 如 果 LRU 位 为 0 则 替换 C1。 

2 路 组 相关 缓存 需要 的 硬件 很 少 ,但 因为 每 次 内 存 访问 (影响 I 和 MEM 阶段 的 流水 设 
it) 都 要 更 新 LRU 位 ， 所 以 也 有 时 间 损 失 。 

用 于 更 高 相关 联 程度 的 LRU 硬件 会 变 得 更 加 复杂 。 假 设 我 们 将 4 个 并 行 缓存 标记 为 
CO. Cl, C2 和 C3， 如 图 9-31 所 示 。 基 于 2 路 组 相关 缓存 ， 每 组 有 一 个 2 位 字段 。 这 2 位 
字段 给 出 最 近 访 问 的 块 。 不 幸 的 是 ， 它 告诉 我 们 最 近 访 问 的 块 ， 但 它 没 有 告诉 我 们 组 中 哪 
块 最 近 很 少 访问 。 对 于 每 组 ， 我 们 真正 需要 的 是 一 个 次 序 矢量 ， 如 图 9-31 所 示 。 例 如 ， 组 
SO 的 次 序列 表示 C2 最 不 常用 ，C1 最 常用 。 也 就 是 说 ，S0 中 的 块 按 访问 时 间 次 序 降 序 排列 
H: C1，C3，C0，C2。 这 样 ， 此 时 ， 如 果 需 要 替换 $0 中 的 块 ， 根 据 LRU 可 判断 蔡 换 C2 
中 的 内 存 块 。 每 次 访问 CPU 都 会 更 新 当前 访问 组 的 次 序 。 图 9-32 显示 了 进行 一 系列 映射 到 
组 S0 的 内 存 访问 时 LRU 次 序 向 量 的 变化 情况 。 每 行 表 示 根 据 当 前 访问 的 块 ， 被 蔡 换 项 是 
如 何 变化 的 。 


ka a. 数据 和 we m ki ee 数据 pa ea ~ LRU 


so 
S1 
S2 
s3 


图 9-31 4 路 组 相关 缓存 的 LRU 信息 











c2 >c3 一 c0 一 c1 
c3 —>c2—>c1—c0 


在 硬件 上 应 用 该 方案 会 怎么 样 ? 4 个 并 行 缓存 的 访问 次 序 矢量 可 能 有 41 =24 个 。 所 以 ， 
我 们 需要 5 位 计数 器 来 对 次 序 矢量 的 24 种 可 能 情况 进行 编码 。8 路 组 相关 缓存 需要 计数 可 的 
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位 数 更 大 以 便 编 码 8 阶乘 的 状态 。 每 个 组 都 需要 维护 一 个 能 够 记录 状态 变化 的 与 有 限 状 态 机 
相关 的 计数 右 ， 如 图 9-32 所 示 。 我 们 可 以 看 到 应 用 这 种 策略 的 硬件 复杂 度 会 随 着 关联 程度 和 
缓存 中 行 数 的 增多 而 加 大 。 还 有 其 他 的 与 真正 的 LRU 方案 近似 但 更 为 简单 的 编码 方式 。 对 于 
很 多 真实 的 程序 序列 ,我 们 有 足够 的 经 验 表 明 低 复杂 度 的 替换 策略 可 能 事实 上 比 真正 的 LRU 
表现 得 更 好 ( 即 导致 更 低 的 缺失 率 )。 


组 SO 的 LRU 








访问 C1 被 替换 项 : 当前 在 C2 中 的 块 
被 蔡 换 项 : 当前 在 CO 中 的 块 
被 蔡 换 项 : 当前 在 CO 中 的 块 
被 替换 项 : 当前 在 CO 中 的 块 
被 替换 项 ， 当前 在 C1 中 的 块 


访问 C2 | c2 一 cl1 一 c3 一 c0 
访问 C2 | c2 一 c1 一 c3 一 c0 
访问 C3 | c3 — c2 一 c1 一 c0 


访问 CO | c0 一 c3 一 c2 一 c1 


图 9-32” 当 遇 到 一 系列 映射 到 组 SO 的 访问 序列 时 ，LRU 矢量 的 变化 


9.15 缺失 类 型 简要 说 明 


我 们 定义 了 3 种 类 型 的 缓存 缺失 : 强制 缺失 (compulsory)、 容 量 缺失 (capacity) 和 冲突 
缺失 (conflict)。 正 如 其 名 ， 强 制 缺 失 是 由 于 程序 在 执行 中 第 一 次 访问 给 定 内 存单 元 造成 的 。 
通常 该 单元 不 在 缓存 中 ,缺失 是 不 可 避免 的 。 我 们 用 发 动机 是 冷 是 热 进行 类 比 (在 启动 时 )， 
将 这 样 的 缺失 称 为 冷 缺失 (cold miss). 

男 一 方面 ， 考 虑 这 一 情况 ，CPU 访问 的 内 存单 元 XX 本 来 是 在 缓存 中 的 ,但 现在 不 在 了 ， 
发 生 了 缺失 9。 这 可 能 有 两 个 原因 : 在 发 生 缺 失 时 缓存 是 满 的 ， 所 以 不 得 不 腾 出 一 些 空间 给 X., 
这 就 是 称 为 容量 缺失 的 原因 。 或 者 可 以 想象 缓存 不 满 ， 但 映射 策略 将 卫 引 入 当前 被 其 他 内 存 
单元 占用 的 缓存 行 ， 这 就 是 所 谓 的 冲突 缺失 。 由 定义 我 们 知道 ， 在 全 相关 缓存 中 不 会 出 现 冲 
突 缺 失 ， 因 为 内 存单 元 可 以 放 在 任何 位 置 。 所 以 ， 在 全 相关 缓存 中 的 缺失 类 型 只 有 强制 缺失 
和 容量 缺失 。 

有 时 候 ， 我 们 很 难 对 缺失 进行 分 类 。 在 全 相关 缓存 中 ,假设 CPU 第 一 次 访问 内 存单 元 
对 ， 此 时 缓存 也 是 满 的 ， 而 这 时 缓存 在 站 处 发 生 缺 失 ， 这 时 是 容量 缺失 还 是 强制 缺失 ?我 们 
可 以 说 都 是 。 所 以 ， 将 这 个 缺失 归 为 强制 缺失 或 容量 缺失 或 两 者 都 是 。 

注意 容量 缺失 可 能 出 现在 直接 映射 缓存 、 组 相关 缓存 或 全 相关 缓存 中 。 人 例如， 考虑 有 4 
个 缓存 行 的 直接 映射 缓存 。 缓 存 初始 化 为 空 ， 每 个 缓存 行 仅 保留 一 个 内 存 字 。CPU 访问 如 下 
的 内 存 访 问 序 列 : 

U0 4,0, 1,:2,.3,5,4 


我 们 将 前 述 地 址 的 内 存 字 表示 为 m0，ml，.…，ms5。 第 一 次 访问 《mg0 ) 是 强制 缺失 。 第 
二 次 访问 (m4) 也 是 强制 缺失 ， 并 且 由 于 直接 映射 结构 它 将 导致 m0 被 蔡 换 出 缓存 。 再 次 访 
问 m0， 也 会 出 现 缺 失 。 因 为 在 引入 m4 时 已 经 将 m0 换 出 ， 这 是 典型 的 冲突 缺失 ,尽管 缓存 
有 其 他 空闲 行 但 还 是 将 m4 HRN m0。 继 续 访 问 ，ml 、m2 和 m3 均 导 致 强制 缺失 。 

之 后 我 们 访问 内 存单 元 m5。 这 在 之 前 的 缓存 中 没有 出 现 过 ， 所 以 m5 导致 的 缺失 应 该 是 
强制 缺失 。 然 而 ， 缓 存 此 时 已 经 有 m0、ml、m2 和 m3， 是 满 的 ， 所 以 我 们 也 可 以 称 之 为 容 


日 ”我们 不 知道 X 为 什么 最 初 会 被 换 出 ， 但 从 分 析 当 前 缓存 缺失 的 角度 来 看 ， 这 一 点 并 不 重要 。 
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量 缺失 。 所 以 我 们 可 以 称 这 种 缺失 为 强制 缺失 或 容量 缺失 或 两 者 都 是 。 

最 后 ， 我 们 又 访问 内 存单 元 m4。 这 可 以 称 为 冲突 缺失 ， 因 为 m4 之 前 在 缓存 中 被 引用 
过 。 然 而 ， 此 时 缓存 被 m0、m5、m2 和 m3 填 满 ， 所 以 我 们 也 可 以 称 它 为 容量 缺失 。 即 我 们 
可 以 称 这 种 缺失 为 冲突 缺失 或 容量 缺失 或 两 者 均 是 。 

强制 缺失 是 不 可 避免 的 。 所 以 ， 这 种 缺失 支配 着 其 他 类 型 的 缺失 。 换 句 话说， 如 果 缺 失 
可 以 分 为 强制 缺失 或 其 他 缺失 ， 我们 将 它 归 为 强制 缺失 。 当 缓存 满 时 ， 独 立 于 结构 ， 我 们 引 
和 人 一 个 当前 不 在 缓存 中 的 内 存单 元 上 的 缺失 。 换 名 话说， 如 果 缺 失 可 以 被 归 为 冲突 缺失 或 容 
量 缺 失 ， 我 们 选择 容量 缺失 。 
假设 下 列 情况 : 

。 在 2 路 组 相关 缓存 中 ， 块 的 总 数目 =8。 

。 采 用 LRU 替换 策略 。 


Cl C2 
0 
] 
2 
3 


处 理 器 以 下 列 顺序 访问 内 存单 元 18 次 : 
0, 1, 8, 0, 1, 16, 8, 8, 0, 5, 2, 1, 10, 3, 11, 10, 16, 8 


对 于 给 定 的 2 路 组 相关 缓存 ， 用 表格 的 方式 给 出 将 占用 内 存单 元 的 缓存 ; 占用 的 具体 缓存 索引 和 缺 
失 类 型 ( 冷 / 强制 缺失 、 容 量 缺 失 、 冲 突 缺 失 )。 





注意 : 

。 缓存 初始 为 空 。 

。 发 生 缺 失 时 ， 如 果 两 个 位 置 (Cl 和 C2 ) 均 为 室 ， 则 将 缺失 内 存单 元 装 入 Cl。 
。 缺 失 为 容量 缺失 或 冲突 缺失 时 ， 将 缺失 的 类 型 归 为 容量 缺失 。 
kI /强制 缺失 或 容量 缺失 时 ， 将 缺失 的 类 型 归 为 冷 /强制 缺 失 。 


$: 
内 存单 元 缺失 类 型 

0 ma=0 || 
I moat || 
8 Oo ee ee | RA 
0 ma=0 | rr 

| | 

16 = | Ko | k | _ 冷 /强制 缺失 
8 e | Rie 

8 ma=0 | | 

0 po RI =0 冲突 缺失 

5 o O ee k ee 
2 gae | | k | 冷 /强制 缺失 
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内 存单 元 命中 /缺失 缺失 类 型 


10 po RN =2 冷 /强制 缺失 

3 Oo zis | | R | eA 

il =3 冷 /强制 缺失 
E 2 i 


16 o | | R | _ 容量 缺失 
8 po RI=0 容量 缺失 


9.16 TLB 和 缓存 整合 


在 第 8 章 中 ， 我 们 引入 了 仅 用 来 保存 地 址 信息 的 TLB 概念 。 对 于 给 定 的 虚 页 号 (VPN), 
如 果 TLB 中 有 对 应 的 物理 页 帧 号 ( PFN)， 则 返回 此 物理 帧 号 。 出 于 访问 速度 的 考虑 ，TLB 通 
常 非常 小 ,但 虚 页 的 空间 非常 大 。 和 处 理 器 缓存 类 似 ， 对 于 给 定 VYPN， 需 要 查询 TLB 的 映射 
Kt Wit TLB 时 的 考虑 因素 与 处 理 器 缓存 设计 时 类 似 ， 即 TLB 可 以 被 组 织 成 直接 映射 或 
组 相关 的 结构 。 根 据 结构 ， 为 了 便于 TLB ÆR, K VPN 划分 为 标记 字段 和 索引 字段 。 下 面 
的 例子 说 明了 这 一 点 。 


假设 : 


31 0 


页 大 小 4K 字 节 


有 512 项 的 直接 映射 TLB。 
a. TLB 中 每 项 的 标记 字段 有 多 少 位 ? 
b. TLB 中 需要 多 少 位 来 存储 页 帧 号 ? 
答 : 
a. 页 大 小 为 4KB， 页 偏 移 量 的 位 数 = 12. 
所 以 ，VPN 所 需 的 位 数 =64 一 12= 52, 
查找 一 个 容量 为 512 的 直接 映射 缓存 所 需 的 索引 位 数 =9。 
所 以 ，TLB 中 标记 的 位 数 =52-9=43 位 。 
b. TLB 中 保存 PFN 所 需 的 位 数 等 于 PFN 的 大 小 。 
页 大 小 为 4KB， 那 么 PFN ® 32-12=20 fi. 


现在 我 们 将 TLB 和 分 级 存储 体系 放 在 一 起 得 到 一 个 整体 的 结构 图 。 图 9-33 显示 了 如 下 
CPU 访问 内 存 的 路 径 (IF 阶段 或 MEM 阶段 ): 
e CPU (在 流水 线 的 IF 或 MEM 阶段 ) 生成 虚拟 地 址 CVA). 
。TLB 完成 虚拟 地 址 到 物理 地 址 (PA) 的 转换 。 如 果 在 TLB 中 命中 ， 那 么 流水 线 不 停顿 
地 继续 执行 。 如 果 发 生 缺 失 ， 流 水 线 暂 停 直到 处 理 完 缺失 。 
。 该 阶段 使 用 PA 来 查找 缓存 (I 缓存 或 D 缓存 ) 。 如 果 在 缓存 中 命中 ， 那 么 流水 线 不 停顿 
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地 继续 工作 。 如 果 发 生 缺 失 ， 流 水 线 暂停 直到 处 理 完 缺失 。 





图 9-33 ”内 存 访问 的 路 径 。 在 绥 存 查询 开始 前 ，CPU 虚拟 地 址 需要 先 通 过 TLB 查找 转换 
成 物理 地 址 


注意 流水 线 的 IF Al MEM 阶段 也 可 能 同时 访问 TLB。 出 于 这 一 点 考虑 ， 大 多 数 处 理 器 
将 TLB 划分 成 指令 部 分 和 数据 部 分 (I-TLB 和 D-TLB)， 所 以 两 个 地 址 转换 能 够 并 行进 行 。 
如 图 9-33 所 示 ，TLB 在 处 理 需 时 钟 周期 中 起 着 关键 作用 ， 因 为 每 次 内 存 访 问 都 需要 先 经 过 
TLB 然后 再 经 过 缓存 。 所 以 ，TLB 很 小 ， 对 于 I-TLB 或 D-TLB 通常 仅 有 64 ~ 256 项 。 


9.17 缓存 控制 器 


缓存 控制 器 是 处 理 天 与 缓存 内 部 和 内 存 系统 其 他 部 分 的 硬件 接口 ， 具 有 如 下 的 功能 : 

。 当 处 理 需 发 出 请 求 时 ， 缓 存 控 制 器 查询 缓存 以 确定 是 否 命中 ， 当 命中 时 将 数据 传 给 处 
FEAF o 

。 当 发 生 缺 失 时 ， 它 初始 化 总 线 事务 以 便 从 更 高 级 的 分 级 存储 体系 中 读 取 缺 失 的 块 。 

。 根 据 内 存 总 线 的 细节 设计 ， 请 求 的 数据 块 相 对 于 该 请 求 可 能 会 异步 到 达 。 在 这 种 情况 
下 ,缓存 控制 此 接收 数据 块 并 将 它 保存 在 缓存 的 合适 位 置 。 

。 我 们 将 在 下 一 章 看 到 ， 控 制 器 给 处 理 融 提供 详细 说 明 内 存 的 哪些 区 域 是 “不 可 缓存 ” 
的 能 力 。 当 我 们 处 理 IO 设备 到 处 理 需 的 接口 时 ， 这 种 需求 变 得 很 明显 〈 见 第 10 章 )。 


考虑 如 下 的 分 级 存储 体系 : 
。 将 128 项 的 全 相关 TLB 分 为 两 部 分 : 一 部 分 用 于 用 户 进程 ， 另 一 部 分 用 于 内 核 。TLB 每 个 时 
钟 周期 允许 访问 一 次 。TLB 的 命中 率 为 95%。 缺 失 发 生 时 会 访 主 存 以 便 完 成 地 址 转换 。 
e。 LI 缓存 有 1 个 周期 访问 时 间 ， 命 中 率 为 99%。 
。L2 缓存 有 4 个 周期 访问 时 间 ， 命 中 率 为 90%。 
。L3 缓存 有 10 个 周期 访问 时 间 ， 命 中 率 为 70%。 
。 物理 内 存 有 100 个 周期 访问 时 间 。 
计算 分 级 存储 体系 的 平均 内 存 访问 时 间 。 注 意 页 表 项 本 身 也 可 能 在 缓存 中 。 
答 : 
回想 9.4 节 的 公式 : 
EMAT, = T; + m; X EMAT,,, 
EMAT 444 = 100 周期 
EMAT,, = 10 + (1 — 0.7) x 100 = 40 周期 
EMAT = (4) + (1 — 0.9) x (40) = 8 周期 
EMAT,, = (1) + (1 — 0.99) X (8) = 1.08 周期 
EMAT = (1) + (1 — 0.95) X (1.08) = 1.054 周期 
EMAT zasu = EMAT 3 + EMAT,, = 1.054 + 1.08 = 2.134 周期 
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9.18 虚拟 索引 物理 标记 的 缓存 


如 图 9-33 所 示 ， 我 们 看 到 每 次 内 存 访 问 都 会 查找 TLB， 然 后 查找 缓存 。TLB 有 助 于 避 
免 在 主 存 中 进行 地 址 转换 。 然 而 ，TLB 查询 在 CPU 路 径 的 关键 位 置 上 。 这 意味 着 虚拟 地 址 到 
物理 地 址 的 转换 在 时 间 上 要 先 于 在 缓存 中 查找 内 存单 元 对 应 的 数据 。 换 句 话 说 ， 由 于 缓存 查 
WE TLB 查询 之 后 ， 所 以 在 CPU 得 到 缓存 中 的 内 存 访问 是 否 命中 前 会 有 很 明显 的 时 延 。 我 
们 希望 能 够 并 行进 行 TLB 的 地 址 转换 和 缓存 中 的 查找 。 换 句 话 说， 我 们 不 希望 地 址 转换 “ 打 
H” CPU 访问 缓存 。 即 我 们 希望 绕 过 TLB 来 获取 CPU 地 址 并 查找 缓存 。 起 初 ， 这 似乎 不 可 
能 实现 ， 因 为 我 们 需要 用 物理 地 址 来 查找 缓存 。 

让 我 们 重新 看 看 图 9-34 中 的 虚拟 地 址 。 地 址 转 VPN 
换 完 成 从 VPN 到 PFN 的 改变 。 然 而 ， 虚 拟 地 址 的 
页 偏 移 量 部 分 是 不 变 的 。 Uk 

直接 映射 缓存 或 组 相关 缓存 用 物理 地 址 的 最 低 有 效 位 作为 查找 的 索引 ( 见 图 9-11 )。 

这 给 我 们 启示， 如 果 我 们 从 虚拟 地 址 的 不 变化 部 分 ( 即 页 偏 移 量 部 分 ) 得 出 缓存 索引 ， 那 
么 我 们 就 可 以 并 行进 行 缓存 查找 和 TLB 查找 。 我 们 将 这 样 的 结构 称 为 虚拟 索引 的 物理 标记 的 
( virtually indexed physically tagged) 缓存 ( 见 图 9-35 )。 绥 存 使 用 虚拟 地 址 中 的 索引 ， 但 标记 
位 从 物理 地 址 获得 。 





图 9-35 ”虚拟 索引 的 物理 标记 的 缓存 。 使 用 在 地 址 转换 时 保持 不 变 的 虚拟 地 址 中 的 位 (页 
偏 移 量 )， 缓 存 查 找 可 以 与 TLB 查找 并 行 执行 


如 果 再 多 思考 一 下 ， 不 难看 出 这 种 策略 的 局 限 性 。 虚 拟 地 址 的 不 变化 部 分 限制 了 缓存 的 
大 小 。 例 如 ， 如 果 页 大 小 为 SKB ， 那 么 缓存 索引 的 位 数 最 多 是 13 位 ， 通 常会 更 小 ， 因 为 最 低 
有 效 位 会 指定 块 偏 移 量 。 尽 管 有 这 些 限 制 ， 但 增加 组 相关 程度 可 以 增加 缓存 大 小 。 然 而 ， 因 
为 增加 相关 程度 也 增加 了 硬件 设计 的 复杂 度 ， 所 以 增加 相关 程度 也 是 有 限制 的 。 

软件 和 硬件 之 间 的 合作 关系 有 助 于 减轻 这 种 限制 。 尽 管 硬件 实现 地 址 转换 ， 但 内 存 管 
理 器 是 建立 VPN 到 PFN 映射 的 软件 实体 。 通 过 仔细 选择 转换 进程 和 VPN 到 PFN 映射 ， 
内 存 管理 器 使 用 称 为 页 面 着 色 (page coloring) 的 技术 来 保证 虚拟 地 址 的 更 多 位 保持 不 变 
( 见 例 9-7)。 页 面 着 色 人 允许 处 理 器 使 用 更 大 的 、 虚 拟 索 引 的 和 物理 标记 位 的 缓存 ， 并 独立 
于 页 面 大 小 。 

男 一 种 解决 地 址 转换 问题 的 方法 是 使 用 虚拟 标记 的 ( virtually tagged) 缓存 。 在 这 种 情况 
下 ， 缓 存 使 用 虚拟 索引 和 标记 。 读 者 需要 考虑 遇 到 的 挑战 ， 例 如 结构 等 。 关 于 这 种 缓存 的 讨 
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论 超出 了 本 书 的 范围 。” 


考虑 虚拟 索引 的 和 物理 标记 的 缓存 : 
1) 虚拟 地 址 是 32 位 
2) 页 面 大 小 为 8KB 
3) 缓存 的 指标 如 下 : 
。4 路 组 相关 缓存 . 
e 总 大 小 = 512KB。 
。 块 大 小 = 64 字 节 。 
内 存 管理 器 使 用 页 面 着 色 来 获得 大 的 缓存 大 小 。 
1 ) 对 于 分 级 存储 体系 ， 虚 拟 地 址 需要 多 少 位 保持 不 变 ? 
2) 用 图 描述 地 址 转换 和 缓存 查找 ， 标 记 其 中 使 用 的 虚拟 地 址 和 物理 地 址 。 
答 : 
页 面 大 小 8KB 表明 页 偏 移 量 是 13 位 ， 剩 余 19 位 是 VPN. 
缓存 中 : 4 / X64 字 节 / 块 =256 字 节 /组 ， 且 
512KB 缓存 总 容量 /256 字 节 /组 =2K 组 ， 即 索引 需要 11 位。 
所 以 缓存 的 内 存 访问 分 解 为 : 
Ri. 15 位 ; 索引 ，11 位 ; 偏 移 量 ，6 位 。 
那么 内 存 管理 软件 需要 以 如 下 方式 将 帧 分 配给 页 面 : VPN 最 低 的 4 位 必须 和 PFN 最 低 的 4 位 相等 。 [403 











VPN/PEN 19 位 页 偏 移 量 13 位 







这 4 位 必须 在 
EE = 
TUTTE ER 
偏 移 量 


标记 15 位 索引 11 位 





9.19 缓存 设计 因素 概述 


目前 我 们 已 经 介绍 了 很 多 概念 ， 在 讨论 主 存 前 很 有 必要 对 这 些 概念 进行 一 一 列举 : 
1 ) 时 间 和 空间 局 部 性 原理 ( 9.2 市 )。 

2 ) 命中 、 缺 失 、 命 中 率 、 缺 失 率 、 周 期 时 间 、 命 中 时 间 ， 缺 失 损失 ( 9.3 79). 
3) 多 级 缓存 及 其 设计 考虑 因素 ( 9.4 1). 

4) 直接 映射 缓存 ( 9.6 市 )。 

5) BARE / 写 算法 (9.8 节 )。 

6) 空间 局 部 性 和 块 大 小 (9.10 市 )。 

7) 全 相关 和 组 相关 缓存 (9.11 市 )。 

8) I 缓存 和 DD 缓存 考虑 因素 (9.12 市 )。 

9 ) 缓存 蔡 换 策略 (9.14 市 )。 

10 ) 缺失 类 型 ( 9.15 节 )。 

11 ) TLB MRF (9.16 7). 

12) 缓存 控制 胡 (9.17 T )o 

13 ) 虚拟 索引 的 和 物理 标记 的 缓存 (9.18 WW). 


日 ” 见 高 级 计算 机 体系 结构 关于 这 部 分 的 更 深入 探讨 (例如 [Hennessy, 2006])。 


gH 


现代 处 理 器 有 片上 TLB、L1 和 L2 缓存 。TLB 和 LI1 设计 时 的 主要 考虑 因素 是 减少 命中 
时 间 ， 这 两 者 设计 时 主要 的 考虑 因素 是 一 致 的 。TLB 通常 是 一 个 小 的 用 于 地 址 转换 的 全 相关 
RT., KA 64 ~ 256 个 缓存 项 。TLB 通常 分 为 系统 部 分 (用 于 保留 上 下 文 切换 ) 和 用 户 部 
分 ( 当 上 下 文 切换 时 刷新 用 户 部 分 )。 有 些 处 理 器 在 TLB 项 中 提供 进程 标志 来 避免 上 下 文 切 换 
时 的 刷新 。L1 缓存 用 于 优化 访问 速度 ,通常 ， 它 分 为 1 缓存 和 DD 缓存 ， 具 有 很 小 的 相关 程度 
(通常 为 2)， 并 且 与 更 高 级 的 分 级 存储 体系 相 比 大 小 更 小 (I 缓存 和 D 缓存 在 2008 年 前 后 大 
小 通常 都 小 于 64KB )。L2 缓存 设计 的 主要 目的 是 为 了 减少 缺失 率 ， 通常 它 的 1 缓存 和 DD 缓存 
是 一 体 的 ， 并 且 相 关 程 度 更 大 (4 路 和 8 路 比较 常见 ， 也 有 16 路 的 )。 为 了 降低 缺失 率 ，L2 
缓存 的 块 大 小 可 以 比 L1 大 。2008 年 前 后 处 理 器 设计 中 L2 缓存 大 小 为 几 百 KB 到 几 MB 之 间 。 
大 多 数 的 现代 处 理 器 提供 片 外 L3 缓存 ， 设 计时 的 考虑 重点 与 L2 类 似 ， 但 容量 更 大 ( 2008 年 
前 后 处 理 器 中 约 为 几 十 MB )。 


9.20 主 存 的 设计 因素 


处 理 器 内 存 总 线 的 设计 和 物理 内 存 的 结构 在 分 级 存储 体系 的 性 能 中 扮演 着 重要 角色 。 正 
如 我 们 前 面 提 到 的 ， 与 CPU 相 比 ， 应 用 DRAM 技术 的 物理 内 存 有 大 约 100:1 的 速度 差 。 当 
发 生 缓 存 缺 失 时 这 种 设计 可 能 要 多 次 访问 物理 内 存 ， 取 决 于 处 理 需 内 存 总 线 的 宽度 和 缓存 块 
的 大 小 。 

本 书 希 望 能 带动 读者 一 起 去 发 现 这 些 有 趣 的 概念 ， 我 们 从 主 存 系统 设计 中 一 些 非常 简单 
的 设计 思想 讲 起 。 一 开始 ， 我 们 希望 读者 理解 这 些 思想 远 没有 今天 我 们 看 到 的 计算 机 里 的 内 
存 系统 复杂 ， 之 后 我 们 将 进行 关于 现代 主流 内 存 系 统 设计 的 讨论 。 

首先 ， 我 们 考虑 3 种 不 同 的 内 存 总 线 结构 和 相应 的 缺失 损失 。 为 了 讨论 方便 ， 我 们 假设 
CPU 产生 32 位 的 地 址 和 数据 ; 缓存 块 大 小 是 4 个 字 ， 每 个 字 32 位 。 


9.20.1 简单 的 主 存 


图 9-36 展示 了 简单 的 内 存 系 统 的 结构 。 当 发 生 缓存 缺失 时 它 发 送 块 读 请 求 。CPU 简单 地 
将 块 地 址 发 给 物理 内 存 。 物 理 内 存在 内 部 对 块 的 连续 地 址 进行 计算 ， 从 DRAM 中 获取 相关 的 
字 ， 并 将 它们 一 个 一 个 地 发 送 给 CPU. 


地 址 







地 址 (32 位 ) 





主 存 
(32 位 宽 ) 


图 9-36 ”简单 的 内 存 系 统 。CPU 的 最 大 内 存 访 问 单元 和 内 存 的 传输 单元 是 一 样 的 (都 是 
32 位 的 数据 ) 
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假设 DRAM 的 访问 时 间 是 70 个 周期 ，CPU 与 内 存 之 间 地 址 或 数据 的 总 线 周期 时 间 是 4 个 周期 。 
计算 块 大 小 为 4 个 字 的 块 传输 时 间 。 假 设 在 数据 传输 给 CPU 之 前 这 4 个 字 是 第 一 次 从 DRAM 中 获取 。 
AE , 


从 CPU 到 内 存 的 地 址 传输 时 间 =4 个 周期 s 

DRAM 访问 时 间 =70x4=280 个 周期 (4 个 连续 字 )。 

从 内 存 到 CPU 的 数据 传输 时 间 =4x4=16 个 周期 (4 个 字 ) 
块 的 总 传输 时 间 = 300 个 周期 。 


9.20.2 与 缓存 块 大 小 相 匹配 的 主 存 和 总 线 


为 了 降低 缺失 损失 ， 我们 将 处 理 器 内 存 总 线 和 物理 内 存 与 块 大 小 进行 匹配 ， 图 9-37 展示 
了 该 结构 。 这 种 结构 用 单 总 线 周 期 将 块 从 内 存 传输 到 CPU， 并 且 对 DRAM 只 进行 一 次 访问 。 
块 的 全 部 4 个 字 构 成 DRAM 中 的 一 行 ， 这 样 可 以 通过 单个 块 地 址 进行 访问 。 然 而 ， 因 为 我 们 
需要 128 位 宽 的 数据 总 线 ， 所 以 这 是 以 复杂 的 硬件 设计 为 代价 的 。 


地 址 





地 址 (32 位 ) 


主 存 
( 128 位 宽 ) 


图 9-37 “与 缓存 块 大 小 相 匹 配 的 主 存 结构 。 内 存 是 按 块 组 织 的 ， 当 发 生 缺 失 时 ， 使 用 更 
宽 的 数据 总 线 ( 128 位 )， 传 输 包 含 缺 失 内 存 字 的 整 块 406 


假设 DRAM 的 访问 时 间 是 70 个 周期 ，CPU 和 内 存 之 间 的 地 址 或 数据 的 总 线 周 期 时 间 是 4 个 
周期 。 计 算 内 存 系统 的 块 传输 时 间 ， 这 里 总 线 宽度 和 内 存 结构 与 4 个 字 的 块 大 小 相 匹 配 。 
答 : 
从 CPU 到 内 存 的 地 址 传输 时 间 =4 个 周期 。 
DRAM 的 访问 时 间 = 70 个 周期 (全 部 4 个 字 通 过 单 次 DRAM 访问 获取 )。 
从 内 存 到 CPU 的 数据 传输 时 间 =4 个 周期 
块 的 总 传输 时 间 = 78 个 周期 。 


9.20.3 ”交错 式 内 存 


从 硬件 角度 考虑 ， 在 前 一 种 设计 中 增加 总 线 宽 度 的 做 法 是 不 现实 的 。 幸 运 的 是 ， 还 有 
其 他 方法 能 够 获得 前 一 种 设计 中 的 性 能 优势 ， 我 们 可 以 通过 一 种 称 为 内 存 交 错 ( memory 
interleaving) 的 工程 技巧 实现 。 图 9-38 显示 了 交错 式 内 存 系统 的 结构 ， 主 要 思想 是 设计 多 个 
内 存 库 ( bank)。 每 个 库 负 责 提 供 缓 存 块 的 特定 字 。 例 如 ， 缓 存 块 由 4 个 字 构 成 ， 我 们 有 4 个 
内 存 库 ，M0、M1、M2 和 M3。M0 提供 字 0，MI1 提供 字 1，M2 提供 字 2，M3 提供 字 3。 
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CPU 发 送 块 地 址 ， 块 地 址 被 4 个 库 同 时 接收 。 内 存 库 是 并 行 工作 的 ， 每 个 内 存 库 在 DRAM 阵 
列 中 查找 它 负 责 的 块 中 的 字 。 当 这 些 字 被 检索 到 时 ， 利 用 与 第 一 个 简单 的 主 存 结构 类 似 的 标 
准 总 线 ， 内 存 库 轮流 问 CPU 发 送 数据 。 


数据 


(32 位 ) 内 存 库 MO 


(32 位 宽 ) 


内 存 库 MI 


(32 位 宽 ) 





内 存 库 M2 
| (32 位 宽 ) E 
内 存 库 M3 
(32 位 宽 ) 


图 9-38 ”交错 式 主 存 。 当 收 到 块 地 址 时 ， 每 个 内 存 库 依次 发 送 块 中 的 字 【〈 它 保存 的 字 ) 


交错 式 内 存 系统 主要 考虑 DRAM 访问 是 处 理 需 内 存 交 互 中 最 耗 时 的 部 分 。 这 样 ， 交 错 式 
内 存在 避免 硬件 复杂 性 的 情况 下 达到 了 接近 宽 内 存 时 的 性 能 情况 。 


假设 DRAM 的 访问 时 间 是 70 个 周期 ，CPU 和 内 存 之 间 地 址 或 数据 的 总 线 传输 时 间 是 4 个 周 
期 。 计 算 图 9-38 中 的 交错 式 内 存 系统 的 块 传输 时 间 。 
答 : 
从 CPU 到 内 存 的 地 址 传输 时 间 =4 个 周期 (4 个 内 存 库 同 时 接收 地 址 )。 
DRAM 的 访问 时 间 =70 个 周期 (4 个 字 被 4 个 库 并 行 检索 )。 
从 内 存 到 CPU 的 数据 传输 时 间 =4X4 个 周期 (内存 库 轮流 将 各 自 的 数据 发 送 到 CPU). 
块 的 总 传输 时 间 = 90 个 周期 。 


目前 ， 在 内 存 系统 设计 中 ， 我 们 考虑 的 主要 因素 是 让 人 处理 右 尽 可 能 地 保持 紧 忙 状态 。 这 
也 意味 着 ， 当 发 生 缓存 读 缺 失 时 ， 从 内 存 到 处 理 带 的 数据 传输 要 尽 可 能 快 。 向 交错 式 内 存 系 
统 写 数据 和 回 常 规 内 存 系统 写 数 据 没 有 什么 差别 。 大 多 数 情 况 下 ， 处 理 需 利用 一 些 技术 【( 例 
如 9.8.2 节 讨 论 的 写 缓 冲 区 技术 ) 避免 了 加 内存 写 数据 市 来 的 延迟 。 然 而 ， 许 多 处 理 怖 内 存 总 
线 支 持 在 交错 式 内 存 系统 中 运行 得 较 流畅 的 块 写 操作 ， 特 别 是 对 于 整个 缓存 块 的 回 写 。 


9.21 现代 主 存 系 统 分 析 


现代 内 存 系 统 与 前 面 介 绍 的 简单 思想 相距 甚 远 。 交 错 式 内 存 已 经 过 时 。 利 用 现代 技术 ， 
交错 思想 现在 主要 体现 在 DRAM 蕊 片 本 身 中 。 让 我 们 来 解释 这 是 如 何 工作 的 。 在 2010 年 前 
Ja, DRAM 芯片 能 够 在 一 片上 容纳 4G 位 。 

然而 ， 为 了 更 好 地 进行 表述 ， 我们 假设 DRAM 芯片 有 64 x 1 个 位 容量 。 也 就 是 说 ， 如 果 
我 们 假设 这 个 芯片 有 一 个 6 位 地 址 ， 每 个 地 址 对 应 1 位 数据 。DRAM 存储 的 每 1 位 称 为 单 
元 (cell)。 在 实际 中 ，DRAM 单元 是 按照 矩阵 排列 的 ， 如 图 9-39 所 示 。 正 如 图 中 所 描述 的 ， 
6 位 地 址 被 分 为 行 地 址 i (3 位) 和 列 地 址 j (3 位)。 为 了 访问 DRAM 芯片 中 的 一 位 ， 你 必 
须 首先 提供 3 位 行 地 址 i ( 称 为 行 访问 选 通 信号 ,或 RAS， 请求)。DRAM 心 片 会 选择 整个 
Sift, WE 9-39 所 示 。 然 后 你 必须 提供 3 位 列 地 址 j ( 称 为 列 访问 选 通 信号 , 或 CAS, 请 


求 )。 它 选 出 了 6 位 地 址 对 应 的 特定 位 ， 并 将 它 传 递 给 内 存 控制 器 ， 内 存 控制 器 会 将 它 传 给 CPU。 


64 x 1 位 DRAM 排列 成 
1 位 单元 的 8x8 阵列 








3 科 3 和 位 





行 缓 冲 


图 9-39 访问 64x1 位 DRAM。 通过 行 地 址 将 DRAM 中 的 整个 行 选 出 ; 通过 列 地 址 选 出 
该 行 中 的 特定 位 


对 于 一 个 1G 位 的 芯片 3， 我 们 需要 一 个 32K x 32K 的 单元 阵列 。 这 种 情况 下 行 缓冲 区 的 
大 小 是 32Kb。 很 有 必要 知道 DRAM 的 周期 时 间 是 如 何 构 成 的 。 正 如 前 面 所 讲 ，DRAM 中 的 
每 个 单元 都 是 一 个 电容 电 人 入。 当选 定 某 行 时 ,会 有 电路 (图 中 没有 标明 ) 感应 选中 行 每 个 单元 
的 电容 电信 ， 并 将 行 缓冲 区 中 的 相应 位 的 值 缓存 为 0 或 1。 从 这 点 考虑 ， 读 DRAM 是 破坏 性 的 
操作 。 通 常 在 读 取 选 中 行 后 ，DRAM 电路 需要 对 该 行 重新 充电 将 它 恢复 为 原来 的 样子 。 这 种 破 
坏 性 的 读 之 后 跟着 进行 充电 的 操作 过 程 中 伴随 着 行 和 列 的 地 址 解码 ， 以 及 计算 DRAM 周期 时 间 
的 时 间 累 加 。 将 阵列 中 的 特定 行 读 到 缓存 是 整个 操作 中 最 费时 间 的 部 分 。 你 可 以 很 快 发 现 ， 在 
完成 这 些 操作 后 ， 这 行 中 只 有 与 列 地 址 对 应 的 1 位 被 使 用 ， 其 他 位 都 被 丢弃 。 我 们 在 稍 后 将 会 
看 到 (UL 9.21.1 市 ) 如 何在 不 将 它们 全 部 丢弃 的 情况 下 使 用 行 缓冲 区 中 尽 可 能 多 的 数据 。 

我 们 可 以 重新 设计 DRAM 的 结构 ， 这 样 每 个 单元 (i, 站 不 会 对 应 1 位 ， 而 是 对 应 上 位 。 
例如 ,一 个 1M x8 位 的 DRAM 有 一 个 1K x IK 的 单元 阵列 ， 阵 列 中 每 个 单元 包含 8 位 。 地 
址 和 数据 通过 芯片 上 的 引 脚 (pin) 传送 给 DRAM 芯片 ( 见 图 9-40 )。 芯 片 设计 的 一 个 主要 考 
虑 因素 是 减少 这 样 的 输入 /输出 引 脚 。 我 们 发 现 
驱动 芯片 中 的 逻辑 单元 所 需 的 电流 非常 小 ， 但 将 
逻辑 信号 传人 和 传 出 芯片 需要 相对 较 大 的 电流 。 
这 意味 着 芯片 边缘 繁重 的 信号 驱动 电路 消耗 摊 了 
本 来 可 以 用 作 其 他 应 用 的 电能 (如 逻辑 或 内 存 操 
作 )。 由 于 这 个 原因 ，DRAM 中 的 单元 以 方形 阵 
列 进行 存储 ， 而 不 是 线性 阵列 ， 所 以 同样 一 组 引 
脚 以 时 间 复 用 方式 将 行 和 列 地 址 发 送 给 DRAM 图 9-40 三 星 的 2Gb DDR3 DRAM 芯片 。 单 





芯片 。 这 就 是 来 自 DRAM 芯片 用 语 的 行 地 址 选 独 的 2Gb DDR3 芯片 如 图 所 示 (项 
通 (Row Address Strobe, RAS) 和 列 地 址 选 通 部 和 底部 视图 ) ; 印刷 电路 板 上 设计 
(Column Address Strobe，CAS)。 对 行 和 列 地 址 相关 的 电路 并 将 这 些 芯 片 装配 在 一 
使 用 共享 引 脚 的 缺点 是 它们 需要 按 顺 序 发 送 给 起 实现 一 个 8GB 的 内 存 模 块 


DRAM 芯片 ， 这 就 增加 了 DRAM 芯片 的 周期 时 间 .。 
© 1G 位 是 22 位 。 
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下 面 的 例子 说 明了 如 何 用 这 些 基 本 的 DRAM 芯片 来 设计 一 个 主 存 系统 。 


利用 如 下 信息 ， 设 计 一 个 主 存 系统 : 

。 处 理 器 到 内 存 总 线 
。 地址 线 = 20 
。 数据 线 =32 

。 每 次 处 理 器 到 内 存 的 访问 都 返回 一 个 地 址 线 指定 的 32 位 字 。 

e DRAM 芯片 的 细节 信息 : 1MX8 位 

答 : 
主 存 系统 的 总 大 小 =2” 字 X32 位 / 字 =1M 字 =32Mb。 
所 以 我 们 需要 4 个 DRAM 芯片 ,每 个 DRAM 芯片 有 1MX8 位， 采用 如 图 9-41 所 示 的 结构 。 


10 位 104% 


CPU 地 址 





图 9-41 使 用 1M x8 位 DRAM ih AY 32M 位 内 存 系统 。 内 存 控制 器 依 序 向 4 个 DRAM 
芯片 提供 10 位 行 地 址 和 列 地 址 。 每 个 DRAM 芯片 利用 10 位 行 地 址 从 各 自 阵 列 
中 选 出 1024 x 8 位 放 入 它们 特定 的 行 缓冲 区 中 ( 行 缓冲 区 大 小 =8 19217). 4 
个 DRAM 芯片 利用 10 位 列 地 址 将 对 应 行 缓冲 区 中 的 唯一 8 位 字 节 读 出 放 在 数 
据 总 线 上 


很 容易 将 上 述 设 计 扩 展 成 按 字 节 寻 址 的 内 存 系 统 。 例 9-15 说 明了 如 何 利 用 1Gb 的 
DRAM 芯片 建立 一 个 4GB 的 内 存 系 统 。 


利用 如 下 信息 ， 设 计 一 个 4GB 的 主 存 系统 : 
。 处 理 器 到 内 存 总 线 
。 地址 线 =32 
。 数据 线 =32 
。 每 个 CPU 字 都 是 由 4 字 节 构成 的 32 位 的 字 。 
© CPU 支持 按 字 节 寻 址 。 
。 地 址 线 的 最 低 2 位 指定 32 位 字 中 的 字 节 。 
。 每 个 处 理 器 到 内 存 的 访问 都 按 字 地 址 返回 一 个 32 位 的 字 。 
© DRAM 芯片 的 细节 信息 : 1Gb (由 2x1 位 构成 )。 
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£3 位 地 址 中 ， 最 高 30 位 用 作 字 地 址 。 

主 存 系统 的 总 大 小 =2” 字 x4 字 节 / 字 =4GB = 32Gb。 

所 以 ， 如 图 9-42 所 示 ， 为 了 排列 成 二 维 阵列 ， 我 们 需要 32 个 DRAM 芯片 ,每 个 DRAM 芯片 包含 
1Gb。 为 了 对 字 中 的 字 节 进行 写 操 作 ， 内 存 控 制 器 (图 中 没有 显示 ) 将 选择 二 维 阵列 中 合适 的 行 ， 并 将 
15 位 RAS 和 CAS 请求 以 及 其 他 控制 信息 一 起 传送 给 那个 行 。 为 了 读 取 一 个 32 位 的 字 ， 它 将 向 所 有 的 


DRAM 传送 15 位 RAS 和 CAS 请 求 ， 这 样 控制 器 就 得 到 了 一 个 完整 的 32 位 字 。 
15 位 15 位 2 位 
AY FEF hill AB PY 
15 位 行 / 列 地 址 


po 一 Se 





E IE BE oooO 














图 9-42 ”使 用 1Gb DRAM 芯片 的 4GB 内 存 系统 (使 用 类 似 于 例 9-15 中 的 结构 图 )。 为 了 读 
取 32 位 的 字 ， 内 存 控制 器 同时 向 所 有 行 (4 行 ) 顺序 传输 15 位 的 RAS 和 CAS。 
同一 行 上 的 每 个 DRAM 芯片 都 从 各 自 的 阵列 中 利用 RAS 和 CAS 地 址 选 出 特定 的 
位 。 这 样 每 行 提供 所 需 的 32 位 字 的 8 位 以 便 响 应 内 存 控制 器 从 CPU 接收 的 地 址 


生产 厂商 将 DRAM 必 有 片 封装 在 双 列 直 插 式 存 储 模块 (Dual In-line Memory Module, 
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DIMM) 中 。 图 9-43 显示 了 DIMM. 通常 ，DIMM 是 包含 4 ~ 16^ DRAM 芯片 、8 字 节 数 
据 通路 的 小 型 印刷 电路 板 。 目 前 ，DIMM 是 内 存 系 统 的 基本 构件 。 







图 9-43” 双 列 直 插 式 存储 模块 


9.21.1 页 式 DRAM 


回想 一 下 ， 当 对 DRAM 单元 进行 读 操 作 时 会 发 生 什么 ”内 存 控制 器 首先 向 DRAM 提供 行 
地 址 。DRAM 将 整个 选中 行 读 入 行 缓冲 区 中 。 然 后 内 存 控制 器 提供 列 地 址 ，DRAM 在 行 缓冲 区 
中 选择 特定 的 列 ， 并 将 数据 传送 给 内 存 控制 器 这 两 部 分 组 成 了 DRAM 的 访问 时 间 ， 并 代表 大 
部 分 DRAM 周期 时 间 。 正 如 我 们 本 节 前 面 提 及 的 那样 ， 一 旦 选中 的 列 数据 传人 控制 器 ， 行 缓冲 
区 中 的 其 他 都 会 被 丢弃 。 在 图 9-41 和 图 9-42 中 我 们 看 到 ， 同 一 行 的 连续 列 地 址 映射 为 CPU 生 
成 的 连续 内 存 地 址 。 所 以 ， 从 内 存 获 取 一 个 数据 块 也 就 是 从 DRAM 获取 相同 行 的 连续 列 。 回 
想 一 下 设计 交错 式 内 存 使 用 的 技术 ( 见 9.20.3 节 )。 每 个 内 存 库 都 保存 同一 块 中 的 不 同 字 ， 并 
以 连续 的 总 线 周 期 在 内 存 总 线 上 将 它 传送 给 CPU。DRAM 通过 一 种 称 为 快速 页 模式 (Fast Page 
Mode, FPM) 的 技术 支持 相同 的 功能 。 该 技术 能 够 做 到 在 不 增加 额外 RAS 请 求 的 情况 下 ， 人 多 
许 在 连续 的 CAS 周期 中 访问 行 缓冲 区 的 不 同 部 分 。 例 9-16 很 好 地 阐述 了 这 一 概念 。 

例 9-15 中 的 内 存 系统 通过 一 个 块 大 小 为 16 字 节 的 处 理 器 缓存 进行 了 增强 。 解 释 当 发 生 缓存 
缺失 时 内 存 控 制 器 如 何 将 请 求 的 块 传递 给 CPU。 

答 : 

图 9-44 的 上 半 部 分 显示 了 CPU 生成 的 地 址 。CPU 地 址 的 内 存 控制 器 显示 在 图 的 下 半 部 分 。 注 意 列 
地 址 的 最 低 两 位 是 CPU 地 址 中 块 偏 移 量 的 最 高 两 位 。 块 大 小 为 16 字 节 ， 或 者 说 是 4 字 。 被 请 求 缓存 块 
的 连续 的 字 由 第 i 行 4 个 连续 列 给 出 ， 列 地 址 仅 最 低 两 位 发 生 交 化 。 


i 4 位 
31 28 位 413 i 0 
l | 
块 地 址 块 偏 移 量 CPU 地 址 
xy 
i = 15 位 fs = 180 2 位 2 位 


J i 
图 9-44 ”内 存 控制 器 对 32 位 CPU 地 址 进行 解释 。xy 地 址 位 代表 块 中 的 字 。 在 图 9-42 中 ， 
DRAM 芯片 的 每 行 提 供 一 个 字 的 一 个 字 节 。 来 自 内 存 控制 器 的 RAS 请 求 选 出 内 
存 块 中 空间 相 邻 的 字 ， 并 将 它们 放 入 DRAM 的 行 缓冲 区 中 。 为 了 获得 给 定 内 存 
块 的 连续 字 ， 内 存 控制 器 需要 向 DRAM 库 发 出 与 不 同 二 进 制 组 合 xy 相对 应 的 
CAS 请 求 ， 这 样 才能 从 DRAM 的 行 缓冲 区 中 读 取 块 中 的 连续 字 
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例如 ， 假设 块 的 CPU 地 址 是 (i,/), j= 010000011000101。 
我 们 进行 下 述说 明 : 
由 jaxy AR, BP, 代表 列 地 址 7 的 最 高 13 位 。 

为 了 从 DRAM 阵列 中 读 取 整个 块 ， 内 存 控制 器 进行 下 列 操作 : 

1) 为 了 地 址 (i,j), 向 DRAM 阵列 发 送 RAS/CAS 请 求 。 

2) 利用 地 址 ,Jiaxy 多 发 送 3 个 额外 的 CAS AK, XB xy=00, 10, 11. 

每 个 CAS 请 求 都 将 使 DRAM 阵列 发 送 连续 的 4 个 字 (返回 的 第 一 个 字 是 造成 缺失 的 真实 地 址 )。 
内 存 控制 器 在 4 个 连续 内 存 总 线 周 期 中 传输 这 4 个 字 ， 将 它们 返回 给 CPU。 


经 过 这 些 年 的 不 断 发 展 ，DRAM 技术 有 了 很 大 提高 。 本 节 介 绍 了 该 技术 的 部 分 内 容 。 希 
望 读者 通过 这 部 分 内 容 的 学 习 能 够 激发 更 多 的 兴趣 ， 关 注 这 一 领域 在 本 书 范围 之 外 的 更 高 级 
的 主题 。 


9.22 分 级 存储 体系 的 性 能 影响 


CPU 会 与 分 级 存储 体系 有 显 式 或 隐 式 的 交互 : 处 理 器 寄存 器 、 缓 存 (多 个 等 级 )、 主 存 
(Œ DRAM F) 和 虚拟 内 存 〈 在 磁盘 上 )。 离 处 理 需 越 远 的 存储 容量 越 大 ， 速 度 越 慢 。 在 分 级 
存储 体系 中 离 处 理 器 越 远 每 字 节 的 价格 也 越 便宜 。 

正如 我 们 所 讨论 的 ， 尽 管 相 对 速度 和 容量 大 致 保持 相同 ， 但 真实 容量 和 速度 每 年 都 保持 
着 持续 增长 。 表 9-1 就 是 一 个 具体 的 例子 ， 它 对 2006 年 前 后 不 同等 级 的 分 级 存储 体系 的 相对 
延迟 和 容量 进行 了 总 结 。2006 年 前 后 2GHz Pentium 处 理 器 的 时 钟 周 期 时 间 是 0.5ns。 


表 9-1 2006 年 前 后 分 级 存储 体系 的 相对 大 小 和 延迟 


存储 类 型 读 取 一 个 4 字 节 字 的 CPU 时 钟 周期 的 近似 延迟 
CPU 寄存 器 通常 ， 直 接 访问 (0 ~ 1 个 时 钟 周期 ) 
Li 缓存 3 个 时 钟 周期 
L2 缓存 10 个 时 钟 周期 
主 存 (物理 内 存 ) 100 个 时 钟 周 期 


虚拟 内 存 (在 硬盘 上 ) | 1GB ~ ITB ( 兆 兆 字 节 ) | 1000 ~ 10 000 个 时 钟 周期 (不 考虑 处 理 页 错误 的 软件 开销 ) 


分 级 存储 体系 在 系统 性 能 中 扮演 着 重要 的 角色 。 我 们 可 以 看 到 ， 对 于 当前 正在 执行 的 程 
序 ， 缺 失 损失 会 影响 流水 线 处 理 需 的 性 能 。 更 重要 的 是 ， 内 存 系统 和 CPU 调度 器 的 设计 需要 
在 设计 决策 时 了 解 分 级 存储 体系 的 概念 。 例 如 ， 内 存 管理 器 的 页 蔡 换 策略 从 分 级 存储 体系 的 
各 级 中 删除 相关 物理 帧 的 内 容 。 所 以 ,经 历 页 面 错误 的 进程 在 错误 从 磁盘 引入 物理 内 存 之 后 
可 能 会 有 明显 的 性 能 损失 。 直 到 页 面 的 内 容 填 满 了 邻近 级 的 分 级 存储 体系 ， 性 能 损失 才 会 得 
到 缓解 。 

CPU 调度 对 系统 性 能 也 有 类 似 影响 。 上 下 文 切换 的 直接 开销 包括 保存 和 加 载 被 取消 调度 
的 进程 和 新 调度 的 进程 的 进程 控制 块 (PCB )。 刷 新 被 取消 调度 的 进程 的 TLB 是 直接 开销 的 
一 部 分 。 因 为 是 分 级 存储 体系 ， 所 以 上 下 文 切 换 是 间接 开销 。 开 销 表现 为 从 缓存 到 物理 内 存 
分 级 存储 体系 的 不 同 级 的 缺失 。 一 旦 新 调度 的 进程 的 工作 集 达 到 了 分 级 存储 体系 中 离 处 理 需 
较 近 的 级 ， 进 程 将 使 处 理 器 的 真正 性 能 发 挥 出 来 。 这 样 ， 在 计算 CPU 调度 右 使 用 的 时 间 量 子 
(time quantum) 时 有 必要 考虑 由 于 分 级 存储 体系 所 带 来 的 对 上 下 文 切 换 性 能 的 真正 影响 。 
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小 结 
表 9-2 提供 了 本 草 中 的 重要 术语 和 概念 。 
表 9-2 与 分 级 存储 体系 相关 的 概念 总 结 


种 类 备注 


局 部 性 原理 (9.2 节 ) | 空间 访问 连续 的 内 存单 元 
时 间 重用 已 经 访问 的 内 存单 元 











缓存 结构 一 对 一 映射 (9.6 节 ) 
一 对 多 映射 或 一 对 一 映射 (9.11.1 节 ) 
一 对 多 映射 ( 9.11.2 节 ) 
缓存 读 / 写 (9.8 节 ) | 读 命 中 / 写 命中 CPU 访问 的 内 存单 元 在 缓存 中 存在 
读 缺 失 / 写 缺 失 CPU 访问 的 内 存单 元 不 在 缓存 中 
缓存 写 策略 ( 9.8 节 ) | AS CPU 对 缓存 和 内 存 进行 写 操作 
CPU 只 对 缓存 进行 写 操作 ; 当 发 生 替 换 时 更 新 内 存 
缓存 参数 缓存 总 大 小 (S) 按 字 节 计 缓 存 的 总 数据 大 小 
块 大 小 (B) 一 个 数据 块 中 连续 数据 的 大 小 
相关 程度 (p) 给 定 的 内 存 块 在 缓存 中 能 够 保存 的 单元 数 
缓存 行 的 数目 (ZL) S/pB 
缓存 访问 时 间 缓存 中 花 在 检查 命中 / 缺失 的 CPU 时 钟 周期 时 间 
CPU 访问 单元 CPU 和 缓存 之 间 交 换 数据 的 大 小 
内 存 传输 单元 缓存 和 内 存 间 交换 数据 的 大 小 
缺失 损失 处 理 缓存 缺失 所 花 的 CPU 时 钟 周期 时 间 
内 存 地 址 解释 索引 (n) logyL 位 ， 用 来 查找 特定 的 缓存 行 
块 偏 移 量 (b) log.B 位 ， 用 来 选择 块 中 的 特定 字 节 
标记 (t) a-(n+b) 位 (a 是 内 存 地 址 的 位 数 )， 用 来 与 缓存 中 的 
标记 位 进行 匹配 
缓存 项 / 缓存 块 /缓存 表示 数据 块 是 有 效 的 
行 /组 对 于 回 写 ， 表 示 数 据 块 是 否 比 内 存 中 的 新 
用 于 将 标记 与 内 存 地 址 进行 比较 判断 是 否 命 中 
实际 的 数据 块 
性 能 指标 命中 率 (A) CPU 访问 缓存 命中 的 百分比 
缺失 率 (m) l-h 
平均 内 存 延 迟 每 条 指令 的 缺失 数 ws x 缺失 损失 avg 
第 i 级 的 有 效 内 存 访 问 时 间 (EMAT,) | EMAT, = T, + m, x EMAT,., 
有 效 CPI CPI,,. + 内 存 延 迟 ave 
缺失 种 类 CPU 第 一 次 访问 该 内 存单 元 
由 于 相关 程度 有 限 造成 的 缺失 ， 尽 管 缓存 没 满 
缓存 满 时 造成 的 缺失 
替换 策略 先进 先 出 
最 不 常 访 问 的 
内 存 技术 每 位 有 6 个 晶体 管 的 静态 RAM 
每 位 有 一 个 单 晶 体 管 的 动态 RAM 
主 在 DRAM 访问 时 间 DRAM 读 访 问 时 间 










DRAM 读 和 刷新 时 间 
CPU 和 内 存 之 间 的 数据 传输 时 间 
使 用 DRAM 的 页 模式 位 


DRAM 周期 时 间 
总 线 周 期 时 间 
使 用 DRAM 的 模拟 交错 技术 
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PUR RRN RTF A (一 个 例子 ) 


现代 处 理 需 采用 多 级 缓存 。 处 理 器 有 片上 的 LI1 缓存 (分 开 的 指令 和 数据 部 分 ) 和 指令 与 
数据 部 分 为 一 体 的 L2 缓存 ， 这 种 设计 很 常见 。 在 处 理 器 之 外 ， 主 存 之 前 可 能 会 有 L3 缓存 。 
采用 多 核 技术 ， 内 存 系统 正 变 得 越 来 越 复杂 。 例 如 ，AMD 在 2006 年 引入 了 Barcelona Oi 
片 。 这 个 芯片 有 4 个 核 ， 每 个 核 有 自己 的 L1 缓存 (分 开 的 1 缓存 和 DD 缓存 ) 和 L2 缓存 。 而 
之 后 的 13 缓存 被 所 有 核 共 享 。 图 9-45 显示 了 Barcelona 芯片 的 存储 结构 。L1 缓存 是 2 路 
组 相关 缓存 (指令 部 分 64KB， 数 据 部 分 64KB )。L2 缓存 是 16 路 组 相关 缓存 (总 大 小 为 
512KB， 指 令 部 分 和 数据 部 分 是 一 体 的 )。L3 缓存 是 32 路 组 相关 缓存 (2MB 所 有 核 共 享 )。 


ETI B Ba. EF 
i 
制 器 制 器 制 器 制 器 
ene 


Eio sa 
| (2 MB) | 














图 9-45 AMD 的 Barcelona 芯片 。 这 个 4 核 世 片 有 3 个 片上 缓存 


练习 题 


1. 将 时 间 局 部 性 和 空间 局 部 性 进行 对 比 。 
2. 将 直接 映射 、 组 相关 和 全 相关 缓存 设计 进行 对 比 。 
3. 有 一 个 同学 设计 了 这 样 一 个 缓存 ， 最 高 有 效 位 用 作 索 引 位 ， 最 低 有 效 位 用 作 标 记 位 。 你 觉得 这 样 的 组 
存 性 能 如 何 ?” 为 什么 ? 
4. 在 标记 位 为 ! 位 的 直接 映射 缓存 中 ， 你 觉得 会 有 多 少 个 标记 比较 器 ?它们 一 次 比较 操作 会 比较 多 少 位 ? 
5. 解释 在 缓存 中 为 什么 要 设计 脏 位 。 
6. 给 出 充足 的 理由 说 明 为 什么 要 使 用 多 级 缓存 分 层 结构 。 
. 缓存 设计 考虑 的 主要 因素 是 什么 ? 讨论 这 些 考 虑 因素 如 何 影响 分 级 存储 体系 的 不 同 级 。 
8. 增加 缓存 块 大 小 的 动因 是 什么 ? 
9. 采用 组 相关 缓存 设计 的 动因 是 什么 ? 
10. 判断 正 误 ， 并 给 出 理由 : 与 L2 缓存 相 比 LIl 缓存 通常 有 更 高 的 相关 程度 。 
1. 给 出 3 个 理由 说 明 L1 缓存 需要 分 为 1 缓存 和 DD 缓存 。 
12. 给 出 充分 的 理由 说 明 在 更 深 级 的 缓存 分 层 结构 中 需要 使 用 统一 的 1 缓存 和 DD 缓存 。 
13. 判断 正 误 ， 并 给 出 理由 : 只 要 有 L2 缓存 ，L1 缓存 设计 就 可 以 只 关注 将 它 的 访问 速度 提升 到 与 处 理 


一 


© Phenom 是 AMD 为 台式 机 生产 的 芯片 品牌 。 


© AMD 的 Phenom 处理 器 数据 表 在 : http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_ 


docs/44109.pdf- 
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14. 你 的 工程 团队 告诉 你 ， 你 有 一 个 总 大 小 为 2MB 的 片上 缓存 。 你 可 以 选择 将 它 设计 成 一 个 大 的 Ll 组 
存 ， 或 两 级 LI 和 L2 缓存 ， 在 不 同 级 缓存 中 划分 I 缓存 和 D 缓存 ， 等 等 。 你 会 做 出 什么 样 的 选择 ? 
为 什么 ?在 做 决定 时 请 考虑 命中 时 间 、 缺 失 率 、 相 关 程 度 和 流水 线 结构 。 对 于 这 个 问题 ， 你 有 足够 
的 理由 给 出 设计 决定 的 定性 解释 . 

“15. 对 于 4 路 组 相关 缓存 ， 使 用 真实 的 LRU 替换 策略 ， 你 需要 用 多 大 的 计数 器 ? 

16. 考虑 下 述 分 级 存储 体系 : 

e。 LI 缓存 : 访问 时 间 =2ns; 命中 率 =99% 
e L2 缓存 : 访问 时 间 =5ns; 命中 率 =95% 
。L3 缓存 : 访问 时 间 =10ns; 命中 率 =80% 
e FF: 访问 时 间 =100ns 
计算 有 效 内 存 访问 时 间 。 
17. 分 级 存储 体系 的 资源 如 下 : 
LI 缓存  2ns 的 访问 时 间 98% 的 命中 率 
L2 缓存 10ns 的 访问 时 间  ?”? 
内 存 60ns 的 访问 时 间 
假设 对 于 LI1 和 1L2 缓存 ， 需 要 使 用 查找 操作 来 看 看 访问 是 缺失 还 是 命中 。 为 了 确保 有 效 内 存 访 
问 时 间 不 超过 3ns，L2 缓存 的 命中 率 需要 保持 为 多 少 ? 

18. 你 需要 为 32 位 处 理 器 设计 缓存 。 内 存 是 按 字 进 行 组 织 的 ， 但 按照 字 节 进行 寻 址 。 你 被 告知 使 用 的 组 
存 为 2 路 组 相关 缓存 ， 每 块 有 64 字 (256 字 节 )。 你 允许 使 用 总 大 小 为 64K 字 (256KB) 的 数据 ( 除 
去 标记 位 、 状 态 位 等 )。 

描绘 缓存 的 布局 。 
说 明 为 了 进行 缓存 查找 ，CPU 生成 的 地 址 如 何 解 释 为 块 偏 移 量 、 索 引 和 标记 位 。 

19. 下 列 关 于 缓存 的 说 法 ， 哪 些 是 正确 的 ? 

。 可 以 用 处 理 器 的 指令 集 架 构 像 操 作 寄 存 器 那样 去 使 用 缓存 。 
© 通常 不 能 直接 使 用 处 理 器 的 指令 集 架 构 对 缓存 进行 操作 。 
。 通 常 缓存 使 用 的 技术 和 主 存 一 样 。 
。 绥 存 通常 比 寄存 器 堆 大 ， 但 比 主 存 小 。 
20. 区 分 冷 缺失 、 容 量 缺 失 和 冲突 缺失 。 
21. 进行 如 下 的 改变 ， 重 做 例 9-7. 
。 总 共 16 个 块 的 4 路 组 相关 缓存 
° LRU 替换 策略 
。 访问 序列 如 下 : 


一 一 


0,1,8,0,1,16,24,32,8,8,0,5,6,2,1,7,10,0,1,3,11,10,0,1,16,8 
22. 进行 如 下 改变 ， 重 做 例 9-8. 
。32 位 虚拟 地 址 ，24 位 物理 地 址 ，8KB 页 大 小 ，64 项 的 直接 映射 TLB 
23. 解释 术语 虚拟 索引 的 物理 标记 的 缓存 (virtually indexed, physically tagged cache)。 这 种 设计 的 优点 是 
什么 ”这 种 设计 的 局 限 性 是 什么 ? 
24. 解释 术语 页 着 色 (page coloring)。 这 项 技术 解决 了 什么 问题 ? 它 是 如 何 工作 的 ? 
25. 进行 如 下 改变 ， 重 做 例 9-10。 
。 虚拟 地 址 64 位 
。 页 大 小 8KB 
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缓存 参数 : 2 路 组 相关 缓存 ， 总 大 小 S12KB ， 块 大 小 32 字 节 
26. 进行 如 下 改变 ， 重 做 例 9-15。 

。 地址 线 和 数据 线 均 为 64 位 

© 64 位 CPU 字 

。 使 用 1Gb DRAM Ñh 
27. 解释 术语 页 模式 DRAM. 


参考 文献 注释 和 扩展 阅读 


从 20 世纪 60 年 代 早 期 缓存 发 明 以 来 ,分 级 存储 体系 就 一 直 是 脑力 工作 者 探讨 的 热点 。 计 算 机 先 
驱 Maurice Wilkes 写 了 第 一 篇 讲解 缓存 思想 的 技术 论文 [Wilkes，1971]。 为 了 深入 理解 缓存 ， 我 们 向 读 
者 推荐 Alan Jay Smith 的 论文 [Smith，1982]。Hennessy and Patterson[Hennessy，2006] 对 许多 先进 的 能 
增强 缓存 性 能 的 优化 技术 进行 了 总 结 。Bryant and O’Hallaron[Bryant, 2003] 对 缓存 设计 基础 和 缓存 对 程 
序 性 能 的 影响 进行 了 总 结 。 内 存 技术 在 不 断 发 展 变化 。 有 这 样 一 个 DRAM 发 展 规律 ,“DRAM 容量 每 3 
年 增长 4 倍 ” 。 基 于 这 样 的 现实 情况 ， 获 取 最 新 内 存 技术 的 渠道 是 生产 商 的 网 页 介绍 。 例 如 ，Samsung、 
Kingston, Hynix 和 Micron 等 公司 引领 着 DRAM 市 场 ， 所 以 这 些 供应 商 的 网 页 是 查找 内 存 技术 最 新 发 
展 状况 的 好 地 方 。 
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为 了 更 好 地 理解 计算 机 ， 接 下 来 我 们 探讨 VO 子 系统 。 在 第 4 章 中 ， 我 们 讨论 了 中 断 ，IO 
设备 通过 中 断 进行 处 理 需 的 任务 切换 。 在 本 章 中 ,我 们 将 说 明 处 理 器 和 IO 设备 间 更 多 的 交 
HATT, RARER, WEA VO 设备 之 间 不 同 数据 的 传送 方式 。 

我 们 首先 讨论 CPU 和 IO 设备 间 通 信 的 基本 范式 。 之 后 我 们 讲解 完成 通信 所 需 的 硬件 机 
fi], LAR CPU 和 IO 间 用 作 数 据 传输 通道 的 总 线 细节 。 对 硬件 机 制 的 补充 是 称 为 设备 驱动 的 
操作 系统 实体 ， 设 备 驱 动 完 成 CPU 和 每 个 特定 IO 设备 间 的 真正 通信 。 稳 定性 存储 在 大 多 数 
计算 机 系统 中 是 通过 硬盘 (hard disk) 提供 的 ， 毫 无 疑问 这 是 计算 机 中 最 重要 、 最 复杂 的 IO 
设备 之 一 。 我 们 将 讨论 硬盘 的 细节 设计 ， 包 括 精 心 设计 的 IO 调度 算法 。 


10.1 CPU 和 IO 设备 间 的 通信 


尽管 我 们 已 经 讨论 了 计算 机 系统 中 的 处 理 需 部 分 ， 但 大 部 分 计算 机 用 户 可 能 还 没有 意识 
到 他 们 正在 使 用 的 很 多 小 工具 中 就 存在 着 处 理 器 。 例 如 ， 手 机 或 iPod 中 就 有 处 理 器 。 我 们 使 
用 iPod 是 因为 它 有 吸引 我 们 的 功能 。iPod 或 手机 都 是 通过 输入 /输出 设备 来 完成 交互 功能 
的 。 因 此 ， 了 解 IO 设备 如 何 与 计算 机 系统 的 其 他 组 件 进行 交互 
是 解 开 计 算 机 神秘 面纱 的 关键 CULE 10-1 )。 尽 管 有 多 种 IO 设 
备 ， 但 它们 与 系统 其 他 部 分 的 连接 方式 非常 类 似 。 正 如 我 们 所 
见 ， 处 理 需 执行 指令 集中 的 指令 。LC-2200 并 没有 直接 对 CD H 
放 器 或 话 简 进 行 操 作 的 特殊 指令 。 接 下 来 我 们 将 学 习 设备 如 何 工 
作 ， 比 如 iPod 如 何 播放 音乐 。 





VO 设备 和 计算 机 之 间 有 一 个 特殊 的 硬件 ， 称 为 设备 控制 器 
(device controller)， 它 扮演 痢 两 着 之 间 桥 染 的 作用 。 设 备 控 制 郑 知 ”图 10-1 设备 控制 器 和 其 
道 如 何在 IO 设备 和 计算 机 间 进 行 交 互 。 他 组 件 间 的 关系 


10.1.1 设备 控制 器 


为 了 讨论 得 更 具体 ， 我 们 考虑 一 个 非 痕 侧 单 的 设备 ， 键 盘 (keyboard)。 当 敲 击 键盘 时 设 
备 里 有 电路 完成 将 按 下 的 键 映 射 成 它 所 代表 的 二 进 制 字符 编码 。 这 种 二 进 制 编码 ， 通 常 称 为 
ASCII (American Standard Code for Information Interchange， 美 国标 准 信 息 交 换 码 格式 )， 需 要 
传送 给 计算 机 。 为 了 实现 这 种 信息 交换 ， 有 两 件 事 是 必需 的 。 首 先 ， 我 们 需要 临时 空间 来 保 
存 输 入 的 字符 。 其 次 ， 我 们 需要 引起 中 断 来 将 字符 传 给 处 理 需 。 这 就 是 设备 控制 右 产 生 的 原 
因 。 我 们 来 思考 一 下 键盘 设备 控制 器 至 少 需要 什么 。 它 有 两 个 寄存 融 : 数据 寄存 器 和 状态 寄 
存 器 。 数 据 寄 存 器 是 保存 键盘 输入 字符 的 存储 空间 。 正 如 其 名 ， 状 态 寄存 左 用 于 将 设备 与 计 
算 机 信息 交换 的 当前 状态 进行 聚合 。 

对 于 键盘 ， 我 们 有 如 下 陈述 。 

© 有 一 位 就 绪 位 (ready bit)， 用 于 回答 问题 “数据 寄存 震中 的 字符 是 不 是 最 新 的 ( 即 处 理 
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从 还 没有 发 现 它 )。 
e 有 一 位 中 断 允 许 位 CInterrupt Enable，IE)， 用 于 回答 问题 “处 理 器 人 允许 设备 中 断 它 吗 ”。 
e 有 一 位 中 断 标志 位 (Interrupt Flag,IF)， 用 于 回答 问题 “特制 器 准备 好 中 断 处 理 器 了 吗 ' 。 
图 10-2 显示 了 简易 的 键盘 控制 器 。 取 决 于 设备 的 复杂 程度 ， 我 们 还 需要 包含 其 他 的 额外 
状态 信息 。 例 如 ， 如 果 设 备 的 输入 速率 超过 了 信息 传递 给 处 理 器 的 速率 ， 那 么 控制 器 中 需要 
有 数据 洲 出 标志 位 (data overrun flag) 来 记录 状态 。 





发 送 的 字符 ， 状 态 寄存 右 保 存 CPU 和 设备 间 交 互 的 当前 状态 


有 时 ,很 有 必要 将 来 自 设 备 的 状态 和 来 自 处 理 絮 的 命令 进行 区 分 。 键 盘 设 备 非常 简 
单 ， 来 日 处 理 絮 的 命令 只 有 打开 和 关闭 中 断 允 许 位 。 一 个 更 复杂 的 设备 (如 照相 机 ) 可 能 
需要 额外 的 命令 (如 照相 、 摇 摄 和 移 轴 等 )。 总 体 上 说 ， 设 备 控制 器 通过 一 组 寄存 器 和 处 
BH ar ETT 20 H.. 


10.1.2 ”内 存 映 射 MO 


接 下 来 ,我 们 探讨 计算 机 如 何 与 设备 控制 希 进 行 连接 。 我 们 必须 以 某 种 方式 让 控制 锅 中 
的 寄存 器 对 处 理 需 可 见 。 一 种 简单 实现 这 一 目标 的 方法 是 使 用 处 理 器 内 存 总 线 ， 如 图 10-3 所 
示 。 处 理 需 使 用 存 取 〈1load / store) 指令 对 内 存 进行 读 和 写 。 如 果 控 制 器 中 的 寄存 器 (数据 寄 
存 器 和 状态 寄存 器 ) 以 内 存单 元 的 形式 呈现 给 CPU， 那 么 处 理 器 可 以 简单 地 使 用 同样 的 存 取 
(load / store) 指令 对 这 些 寄存 怖 进行 操作 。 这 项 技术 称 为 内 存 映 射 IO (memory mapped I/O), 
允许 处 理 器 在 不 发 生 任何 变化 的 情况 下 与 设备 控制 器 进行 交互 。 

将 设备 寄存 器 作为 内 存单 元 使 用 的 技术 很 简单 。 我 们 给 设备 寄存 需 唯 一 的 内 存 地 址 。 例 
如 ， 我 们 随意 选取 内 存 地 址 5000 赋值 给 数据 寄存 融 ， 将 内 存 地 址 5002 赋值 给 状态 寄存 带 。 
键盘 控制 器 里 有 智能 组 件 〈 即 电路 ) 对 这 两 个 地 址 总 线 上 的 地 址 进行 操作 。 人 例如， 假设 处 理 需 
执行 如 下 指令 : 

LW x1, Mem[5000] 

控制 器 识别 出 地 址 5000 与 数据 寄存 器 相对 应 ， 然 后 将 数据 寄存 器 的 数据 放 在 数据 总 线 
上 。 处 理 器 并 不 明 自 这些 内 容 来 自控 制 器 的 一 个 特定 寄存 器 。 它 仅 将 数据 总 线 上 的 值 存 人 寄 
存 器 rl 中 。 
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图 10-3 RE ir Tail air SS Ah a AN FE BP h iY) AF FF a He EE — AY 
Fr MBL, (EPER ae PAY ay FF ae E CPU 看 来 就 像 内 存 地 址 


这 就 是 内 存 映 射 IO 的 魅力 所 在 。 在 不 增加 指令 集中 新 指令 的 情况 下 ， 我 们 已 经 将 设备 
控制 器 集成 到 了 计算 机 系统 中 。 内 存 也 与 总 线 上 的 地 址 进行 交互 ， 你 也 许 会 怀疑 这 项 技术 
是 否 会 使 内 存 和 设备 控制 器 发 生 混乱 。 基 本 思想 是 在 地 址 空间 中 为 设备 控制 器 保留 一 部 分 
空间 。 假 设 有 32 位 处 理 器 ， 并 且 我 们 希望 为 IO 设备 留 出 64KB 的 地 址 空间 。 我 们 可 以 在 
0XFFFF0000 ~ 0xFFFFFFFF 中 任意 为 IO 设备 划分 地 址 ， 并 在 这 个 范围 内 为 我 们 硕 望 为 连 
接 到 总 线 上 的 设备 分 配 地 址 。 例 如 ， 对 于 键盘 控制 占 ， 我 们 硕 望 将 地 址 0xFFFF0000 作为 数 
Hees fF at, Hehi 0XFFFF0002 作为 状态 寄存 器 。 键 盘 设 备 控 制 器 的 设计 会 考虑 这 种 分 配 ， 并 
对 这 些 地 址 做 出 反应 。 这 意味 着 每 个 设备 控制 器 都 有 电路 对 和 总线 上 的 地 址 进行 解码 。 如 果 总 
线 上 的 地 址 和 这 个 控制 器 的 地 址 相 匹配 ， 在 总 线 上 它 会 表现 得 像 内 存 一 样 执行 相关 命令 GE 
和 写 )。 相 应 地 ， 内 存 设 计 会 忽略 划分 给 VO 的 地 址 范围 。 当 然 ， 至 于 划 定 多 少 地 址 范围 给 LI/ 
O 这 只 是 一 个 习惯 问题 。 通 党 习惯 将 高 地 址 空间 留 给 IO 设备 寄存 器 。 

你 也 许 会 惊讶 如 何 将 这 一 信息 与 我 们 在 第 9 章 中 刚刚 学 过 的 分 级 存储 体系 的 细节 相 协 调 。 
如 果 分 配给 设备 寄存 需 的 内 存 地 址 出 现在 缓存 中 ， 处 理 震 会 不 会 从 缓存 中 获取 一 个 旧 数 据 ， 
而 不 是 设备 寄存 器 中 的 内 容 呢 ? 这 是 一 个 关键 问题 ， 正 是 由 于 这 一 原因 缓存 控制 器 才 将 内 存 
的 特定 区 域 设 定 为 “不 可 缓存 的 ”。 即 使 处 理 器 像 读 内 存 地 址 那样 去 读 设 备 寄 存 器 ， 提 前 设置 
为 先 验 的 缓存 控制 器 也 不 会 对 这 些 地 址 进行 缓存 ， 但 每 次 读 它们 处 理 需 都 会 重新 对 它们 进行 
访问 。 

内 存 映 射 IO 的 优点 是 不 需要 额外 的 IO 指令 ; 缺点 是 部 分 内 存 地 址 空间 分 配给 设备 寄 
存 器 ， 所 以 这 部 分 地 址 空间 对 用 户 和 操作 系统 的 代码 和 数据 来 说 是 不 可 用 的 。 有 些 处 理 咒 提 
供 特 殊 的 VO 指令 ， 并 将 LO 设备 连接 到 独立 的 VO 总 线 上 。 类 似 的 设计 ( 称 为 IO RH I/O) 
在 符 入 式 系统 中 非常 常见 ， 因 为 内 存 空间 有 限 。 然 而 ， 因 为 现代 通用 处 理 器 使 用 64 位 地 址 空 
间 ， 在 这 么 大 的 地 址 空间 中 为 IO 保留 一 小 部 分 是 很 合理 的 做 法 。 所 以 内 存 上 映射 1/0 是 现代 处 
理 器 设计 的 选择 ， 尤 其 是 因为 它 很 容易 融入 处 理 器 体系 结构 中 ， 并 且 不 需要 新 的 指令 。 
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10.2 程控 I/O 


既然 我 们 已 经 知道 了 设备 控制 器 与 处 理 器 是 如 何 连接 的 ， 让 我 们 将 注意 力 转 向 在 设备 与 
处 理 器 之 间 是 如 何 相互 传递 数据 的 。 程 控 IO (PIO) 指 的 是 编写 一 个 计算 机 程序 来 完成 数据 
传输 。 为 了 让 讨论 更 具体 ， 我 们 举 前 面 介绍 的 键盘 控制 器 的 例子 。 

让 我 们 来 对 键盘 控制 器 的 步骤 进行 总 结 : 

1 ) 当 新 的 字符 进入 数据 寄存 器 时 它 设 置 状 态 寄存 器 的 就 绪 位 。 

2) 当 CPU 读 取 数据 寄存 器 时 ， 控 制 器 清除 就 绪 位 。 

使 用 键盘 控制 右 的 给 定语 义 ， 我 们 编写 一 个 简单 的 程序 ， 将 来 自 键盘 的 数据 转移 到 处 理 
器 中 (如 图 10-4 所 示 )。 

。 步骤 1: 检查 就 绪 位 (如 图 10-4 所 示 )。 

。 步 又 2: 如 果 就 绪 位 没有 设置 ， 返 回 步骤 1。 

。 步骤 3: 读数 据 寄存 器 中 的 内 容 ( 见 图 10-4 )。 注 意 读 这 个 寄存 器 会 自动 清除 就 绪 位 。 

。 步骤 4: 将 读 入 的 字符 存 人 人 内存 ( 见 图 10-4). 

© 步骤 5: 返回 步 对 1. 





图 10-4 PIO 数据 传输 示例 。 控 制 器 设置 就 绪 位 向 CPU 表明 数据 寄存 器 中 有 新 数据 。CPU 
使 用 简单 的 存 取 (load / store) 指令 将 数据 从 数据 寄存 器 传输 到 内 存 缓冲 区 中 


步骤 1 和 2 构成 了 处 理 器 和 设备 控制 器 之 间 的 握手 。 通 过 这 两 步 ， 处 理 右 不 断 地 检查 设 
备 是 否 有 新 数据 。 换 句 话 说， 处 理 器 轮 询 设备 看 看 是 否 有 新 数据 。 考 虑 处 理 需 与 类 似 键 盘 的 
设备 之 间 的 速度 差异 。1GHz 处 理 器 执行 一 条 指令 大 约 为 Ins。 即 使 打字 速度 非常 快 ， 假设 每 
分 钟 输 入 300 个 字符 ， 控 制 器 每 200ms 输入 一 个 字符 。 处 理 器 在 获得 输入 字符 前 要 对 状态 寄 
存 器 轮 询 数 百 万 次 。 这 对 处 理 器 资源 的 利用 很 没有 效率 。 可 以 给 设备 设置 一 个 中 断 位 来 代替 
轮 询 操作 ， 当 发 生 中 断 时 ， 执 行 前 述 的 指令 来 完成 数据 传输 。 操 作 系 统 调 度 其 他 程序 在 CPU 
上 运行 ， 通过 上 下 文 切换 来 处 理 中 断 ， 如 第 4 章 所 述 。 

通过 轮 询 或 中 断 方式 的 程序 数据 传输 被 低速 设备 使 用 (例如 ， 键 盘 和 鼠标 )， 这 些 低 速 
设备 通常 是 异步 生成 数据 的 。 即 数据 的 生成 和 任何 时 钟 频率 不 合拍 。 然 而 ， 类 似 硬盘 的 高 
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速 设 备 是 同步 产生 数据 的 。 也 就 是 说 数据 是 按照 一 定时 钟 频率 产生 的 。 当 设备 准备 就 绪 时 ， 
如 条 处 理 右 没有 及 时 获取 数据 ， 那 么 很 有 可 能 设备 会 用 新 的 数据 覆盖 掉 旧 的 数据 ， 造 成 数据 
丢失 。 目 前 最 先进 的 处 理 需 的 内 存 总 线 带 宽 为 200MB/s。 总 线 上 的 所 有 实体 (处 理 器 和 设备 
Pe iil ar) 共享 带宽 。 最 先进 的 硬盘 驱动 以 150MB/s 的 速率 产生 数据 。 考 虑 到 数据 生成 速率 和 
可 用 内 存 总 线 带宽 之 间 的 差距 ， 并 不 适合 用 程控 IO 在 内 存 和 像 硬盘 这 样 的 高 速 同 步 设备 之 
间 传 输 数 据 。 

而 且 ， 即 使 对 慢 速 设备 ， 通 过 程控 IO 使 用 处 理 器 对 数据 传输 进行 编排 也 是 对 处 理 器 资 
源 的 当 费 。 在 下 一 节 ， 我 们 引入 一 个 新 的 技术 来 完成 数据 传输 。 


10.3 DMA 


直接 内 存 访问 (Direct Memory Access，DMA )， 正 如 其 名 ， 在 处 理 器 没有 介入 的 情况 下 ， 
设备 控制 右 能 够 与 内 存 进 行 数据 交换 。 

传输 本 号 是 由 处 理 右 进行 初始 化 的 ,但 当初 始 化 完成 ， 就 由 设备 来 完成 传输 操作 。 让 我 
们 来 尝试 理解 DMA 控制 器 中 需要 哪些 技术 。 我 们 认为 控制 器 连接 的 是 一 个 异步 高 速 设备 ， 
如 硬盘。 我 们 认为 这 种 设备 是 流 设备 (streaming devices): 无 论 在 哪个 方 回 (传人 或 传 出 设备 )， 
一 且 数 据 传 输 开 始 ， 数 据 就 会 持续 不 断 地 传人 或 传 出 设备 ， 直 到 传输 完成 为 止 。 

做 一 个 类 比 ， 假 设 你 在 做 饭 。 你 需要 往 炉 灶 上 的 锅 里 倒 水 。 你 使 用 一 个 小 杯子 去 厨房 的 
水 龙头 接 水 ,将 水 倒 入 锅 中 ， 然 后 再 回去 用 杯子 接 水 ,重复 这 个 过 程 直 到 锅 中 的 水 满 为 止 。 
你 知道 如 果 水 龙头 不 打上 ， 水 就 会 一 直流 。 所 以 你 不 断 地 打开 或 关 掉 水 龙头 ， 并 用 杯子 作为 
水 龙头 和 锅 之 间 的 缓冲 区 。 

流 设备 就 像 水 龙头 。 从 设备 中 读数 据 ， 设 备 控制 器 打开 设备 ， 取 出 位 流 ， 将 控制 器 关闭 ， 
把 位 传 入 内存， 之 后 重复 这 些 操作 下 到 完成 了 整个 数据 传输 为 止 。 对 于 向 设备 写 数 据 则 过 程 
相反 。 让 我 们 来 关注 从 设备 读数 据 到 内 存 的 操作 。 回 内 存 传输 数据 的 过 程 中 都 包含 了 什么 ? 
控制 锅 获 取 总 线 并 每 次 向 内 存 传 输 一 字 节 (或 者 其 他 大 小 ,不论 总 线 传输 的 粒度 )。 总 线 是 共 
享 资 源 ， 总 线 上 还 有 包括 处 理 器 在 内 的 其 他 竞争 者 。 所 以 ， 设 备 控 制 问 和 内 存 之 间 的 数据 传 
输 是 异步 进行 的 。 更 糟糕 的 是 ， 如 果 总 线 上 还 有 其 他 优先 级 更 高 的 请 求 ， 控 制 器 可 能 会 在 很 
长 时 间 内 无 法 获得 总 线 。 为 了 缓解 同步 设备 和 异步 总 线 间 的 差异 ， 控 制 絮 需要 一 个 硬件 缓冲 
(hardware buffer)， 类 似 于 做 饭 例 子 中 杯子 的 作用 。 我 们 直觉 上 推断 缓冲 区 应 该 和 设备 与 
设备 控制 句 之 间 异 步 传 输 单元 的 大 小 相同 。 例 如 ， 如 果 设 备 是 摄像 机 ， 那么 单 帧 图 像 (比如 ， 
100K 像素 ) 可 能 是 设备 和 控制 器 之 间 最 小 的 异步 数据 传输 单元 。 因 此 ， 对 于 是 摄像 机 的 设备 
控制 器 情况 ， 硬 件 缓 神 区 的 大 小 至 少 应 该 是 一 个 图 像 帧 的 大 小 。 

为 了 初始 化 一 个 传输 ， 处 理 需 需要 癌 设 备 控 制 器 传输 4 种 信息 : 命令 、 设 备 地 址 、 
内 存 缓 冲 区 地 址 和 数据 传输 量 。 注 意 数据 传输 是 在 设备 空间 和 内 存 空间 的 连续 区 域 之 
间 。 另 外 ， 控 制 器 有 一 个 状态 寄存 器 ， 用 来 记录 设备 状态 。 如 键盘 的 例子 所 示 ， 我 们 可 
以 在 控制 器 中 分 配 5 个 内 存 映 射 寄存 器 : 命令 、 状 态 、 设 备 地 址 、 内 存 缓冲 区 地 址 和 计 
数 。 所 有 这 些 寄存 器 有 分 配给 它们 的 唯一 内 存 地 址 。 图 10-5 显示 了 流 设 备 的 DMA 控制 
髓 的 简化 框图 。 

例如 ， 从 内 存 缓冲 区 中 以 地 址 M 开 始 向 地 址 为 DD 的 设备 中 传输 入 字 节 的 数据 ，CPU 执 
行 如 下 指令 : 

步骤 1: 在 计数 寄存 器 中 存储 N。 
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步骤 2: 在 内 存 缓冲 区 地 址 寄存 器 中 存储 M. 
步骤 3: 将 DD 保存 在 设备 地 址 寄存 器 中 。 

步骤 4: 将 写 设备 命令 保存 在 命令 寄存 器 中 。 
步骤 $: 设置 状态 寄存 需 中 的 开始 (Go) 位 。 










DMA 控制 器 。 ”状态 


Peas 


日 
as 


Zs 
图 10-5 DMA feild. Fell ae PAY Pr BF FF ae BP Be FE A ee, APL CPU 可 
以 通过 存 取 (load / store) 指令 对 它们 进行 操作 


注意 所 有 这 些 步骤 都 是 简单 的 内 存 存 储 指令 (到 目前 为 止 涉 及 CPU 的 情况 )， 因 为 这 些 寄 
Apa RB T ANF 

设备 控制 器 和 CPU 类 似 。 在 设备 控制 器 内 部 ， 有 用 于 执行 从 处 理 器 获取 指令 的 数据 通路 
及 控制 电路 。 例 如 ， 为 了 完成 前 面 所 说 的 传输 ( 见 图 10-6 )， 控 制 器 将 反复 访问 内 存 总 线 ， 将 
N 个 连续 的 字 节 从 内 存 地 址 M 开 始 装 入 缓冲 区 中 。 一 旦 缓冲 区 就 绪 ， 控 制 器 将 以 指定 的 设备 
地 址 将 缓冲 区 中 的 内 容 初始 化 到 设备 中 。 如 果 处 理 器 允许 控制 器 执行 中 断 ， 那 么 当 传 输 完 成 
时 控制 器 将 中 断 处 理 需 。 

设备 控制 器 与 处 理 器 竞争 内 存 总 线 周 期 ， 这 种 现象 通常 称 为 周期 窃 用 ( cycle stealing). 
这 是 一 个 陈旧 的 术语 ， 它 的 起 因 是 因为 处 理 器 通常 是 总 线 的 控制 器。 当 处 理 器 不 需要 它们 时 
EASE (steal) 总 线 周 期 。 从 第 9 章 关 于 分 级 存储 体系 的 讨论 中 我 们 可 以 知道 处 理 顺 在 大 
多 数 情况 下 会 使 用 缓存 中 的 指令 部 分 和 数据 部 分 。 因 为 对 于 设计 良好 的 结构 会 考虑 内 存 总 线 
的 总 带宽 比 连接 到 总 线 的 所 有 设备 (包括 处 理 器 ) 的 需求 总 和 大 ， 所 以 设备 宅 用 处 理 占 的 总 线 
周期 并 不 会 产生 问题 。 
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图 10-6 DMA 数据 传输 示例 。 一 旦 CPU 利用 所 有 需要 的 信息 通过 设置 控制 器 中 的 寄存 
art DMA 进行 初始 化 ， 控 制 器 就 会 在 不 打扰 CPU 的 情况 下 自动 完成 所 要 求 的 
数据 传输 


10.4 总线 


系统 总 线 (或 内 存 总 线 ) 是 整个 设计 中 的 关键 资源 。 从 功能 的 角度 讲 ， 总 线 有 如 下 部 分 : 

。 地址 线 

© 数据 线 

e MOR 

。 RETR 

。 中断 啊 应 线 

。 总 线 仲 裁 线 

电路 上 ， 高 性 能 系统 并 行 运行 这 些 线 构成 了 系统 总 线 。 例 如 ，32 位 寻 址 的 处 理 右 有 32 
位 地 址 线 。 总 线 中 数据 线 的 数目 由 总 线 支 持 的 命令 集 决定 。 正 如 我 们 在 第 9 章 中 讨论 的 那样 ， 
为 了 支持 大 的 缓存 块 大 小 ， 可 以 想象 数据 总 线 的 宽度 比 处 理 右 中 字 宽 度 要 宽 。 命 令 线 会 对 内 
存 系统 的 特定 命令 ( 读 、 写 、 块 读 取 、 快 写 人 等 ) 进行 编码 ， 所 以 命令 线 需 要 有 足够 的 位 数 
来 对 命令 集 进行 二 进 制 编码 。 我 们 在 第 4 章 讨 论 过 人 处理 融和 1/O 设备 之 间 中 断 握手 的 细 市 。 
中 断 线 (和 中 断 响应 线 ) 的 数目 与 所 支持 中 断 级 别 的 数目 相对 应 。 在 第 9 章 中 ， 我们 强调 了 
内 存 系统 的 重要 性 。 在 一 定 意义 上 ， 系 统 的 性 能 主要 由 内 存 系统 的 性 能 决定 ， 所 以 系统 总 线 
作为 访问 内 存 的 窗口 需要 尽 可 能 进行 充分 利用 。 通 常 ， 在 当前 总 线 周期 中 ， 设 备 竞 争 使 用 下 
一 个 总 线 周期 。 在 当前 周期 结束 前 ， 需 要 选择 在 下 一 个 总 线 周 期 中 运行 的 设备 。 从 集中 式 方 
案 (处 理 器 中 ) 到 更 多 分 布 式 方案 ， 有 各 种 总 线 仲裁 (bus arbitration) 技术 。 关 于 总 线 仲裁 方 
案 更 为 详细 讨论 超出 了 本 书 的 范围 。 有 些 较 旧 的 书 会 对 这 个 话题 进行 更 多 的 细节 讨论 〈 例 如， 
[Patterson，1998])。 但 我 们 需要 阅读 一 些 更 高 级 体系 结构 的 书 (例如 ，[Hennessy，2006]) 来 
理解 现代 高 速 处 理 器 如 Intel Pentium 处 理 器 的 系统 总 线 是 如 何 工 作 的 。 

在 过 去 的 几 年 ， 花 费 了 很 多 努力 对 总 线 进行 标准 化 。 标 准 化 的 主要 目的 是 允许 第 三 方 供 
应 商 与 总 线 进行 交互 开发 1/0 设备 。 标 准 化 对 计算 机 生产 商 提出 了 一 个 很 有 意思 的 挑战 。 一 
方面 ， 标 准 化 帮助 了 计算 机 生产 商 ， 因 为 对 于 给 定 平台 这 增加 了 第 三 方 供应 商 提供 的 可 用 外 
围 设备 的 范围 。 但 另 一 方面 ， 为 了 保证 所 生产 产品 的 竞争 性 ， 大 多 数 计算 机 生产 商都 反对 这 
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样 的 标准 化 。 实 际 中 我 们 看 到 了 两 者 的 折 中 选择 。 系 统 总 线 倾向 于 由 制造 商 专 有 设计 ， 并 不 
依赖 于 任何 发 布 的 公开 标准 ， 但 连接 外 围 设 备 的 IO 总 线 倾 向 于 采用 制定 的 标准 。 例 如 ， 外 
围 组 件 互 连 (Peripheral Component Interchange, PCI) 是 IO 总 线 的 公开 标准 。 大 多 数 计 算 机 
生产 商会 支持 PCI 总 线 ， 同 时 提供 内 部 桥接 器 (bridge) 将 PCI 总 线 与 系统 总 线 进 行 连接 ( 见 


图 10-7 ) 。 


图 10-7 ”标准 总 线 与 系统 总 线 共 存 。 桥 接 器 将 CPU 的 内 部 系统 总 线 与 类 似 PCI 的 标准 总 
线 进 行 连 接 


有 些 总 线 设计 将 线路 设计 成 多 种 功能 复 用 的 形式 ， 例 如 PCI 总 线 对 于 地 址 和 数据 使 用 
同样 的 32 条 线路 。 通 过 命令 线 和 协议 细节 来 决定 在 某 时 刻 这 些 线路 中 传递 的 是 数据 还 是 
地 址 。 

在 总 线 设计 中 一 个 很 重要 的 考虑 因素 就 是 控制 机 制 。 总 线 可 以 使 用 同步 方式 进行 操作 。 
在 这 种 情况 下 ,使 用 公共 总 线 时 钟 线 (和 CPU 时钟 类 似 ) 在 单个 设备 上 对 协议 操作 进行 编排 。 
总 线 也 可 以 使 用 异步 方式 进行 操作 。 总 线 控制 器 初始 化 总 线 操 作 ; 当主 线 受 控 器 返回 啊 应 时 
表示 总 线 操作 完成 。 这 种 主 从 关系 避免 了 对 总 线 时 钟 的 依赖 。 为 了 增加 总 线 的 利用 率 ， 高 性 
能 计算 机 系统 使 用 分 离 传输 总 线 (split transaction bus )。 这 个 方案 中 ， 多 个 独立 的 信息 交互 可 
以 同时 进行 。 虽 然 这 增加 了 总 线 的 吞吐 量 ， 但 同时 在 很 大 程度 上 增加 了 设计 的 复杂 性 。 在 计 
算 机 体系 结构 的 很 多 高 级 课程 中 都 会 将 类 似 的 主题 列 在 其 中 。 


10.5 I/O 处 理 痢 


”在 企业 级 应 用 高 性 能 的 系统 中 ， 如 网 络 服务 器 和 数据 库 服务 右 ，LIO 处 理 器 的 IO 任务 与 
主 处 理 器 是 分 离 的 。LO 处 理 器 在 没有 打扰 主 处 理 器 的 情况 下 从 处 理 器 获取 (或 癌 处 理 天 发 送 ) 
一 组 设备 的 一 系列 命令 ， 并 执行 这 些 命令 。LO 处 理 器 减少 了 主 处 理 器 所 经 受 的 中 断 数 。 主 处 
理 器 在 共享 内 存 中 建立 IO 程序 ( 见 图 10-8 )， 并 启动 IO 处 理 器 -IO 处 理 顺 完成 程序 的 执行 ， 
然后 中 断 主 处 理 天 。 
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共享 内 存 VO 总 线 


ao KE 
图 10-8 VO 处 理 器 负责 与 IO 相关 的 管理 任务 ， 尽 量 减 少 了 主 处 理 器 计算 任务 中 的 中 断 


次 数 


在 大 型 机 时 代 ，IBM 推广 VO 处 理 器 。 即 使 在 今天 ， 大 型 机 在 大 的 企业 级 服务 器 中 仍 很 
通用 。IBM 将 这 些 IO 处 理 需 称 为 信道 。 多 路 复 用 信道 (multiplexer channel) 控制 慢 速 面向 
字符 的 设备 ， 如 一 组 终端 或 显示 设备 。 块 多 路 信道 控制 多 个 中 等 速度 的 面向 块 的 设备 (面向 
流 的 设备 ， 如 本 章 中 所 提 的 设备 )， 如 磁带 驱动 器 。 选 择 器 信道 负责 单独 的 、 高 速 的 面向 流 的 
设备 ， 如 磁盘 。 

IO 处 理 器 的 功能 与 DMA 控制 器 类 似 。 然 而 ，LIO 处 理 器 的 级 别 更 高 ， 因 为 它 可 以 执行 
一 系列 的 CPU 命令 (通过 IO 程序 )。 另 一 方面 ，DMA 控制 句 以 从 属 模式 工作 ， 一 次 处 理 一 
个 来 自 CPU 的 命令 。 


10.6 设备 驱动 


设备 驱动 是 操作 系统 的 一 部 分 ， 计算 机 系统 中 的 每 个 设备 都 有 设备 驱动 来 进行 控制 。 
图 10-9 显示 了 系统 软件 的 结构 ， 特 别 是 设备 驱动 和 操作 系统 其 余部 分 之 间 的 关系 ， 如 CPU 
调度 器 、LO 调度 器 和 内 存 管理 器 。 

设备 驱动 软件 的 细节 由 软件 控制 的 设备 特性 所 决定 。 例 如 ， 键 盘 驱 动 可 以 使 用 中 断 驱 动 
的 程控 IO 在 键盘 控制 器 和 CPU 之 间 传 输 数 据 。 男 一 方面 ， 人 硬盘 驱动 胡 (磁盘 ) 的 设备 驱动 
在 磁盘 控制 器 和 内 存 之 间 创 建 DMA 传输 的 描述 符 ， 并 等 待 指示 数据 传输 完成 的 中 断 。 这 里 
你 可 以 感受 到 工作 中 抽象 的 优点 ， 就 相关 的 设备 驱动 而 言 ， 我 们 并 不 关心 设备 的 具体 细节 。 
例如 ， 设备 可 以 是 诸如 键盘 或 鼠标 这 样 的 慢 速 设备 。 就 设备 驱动 而 言 ， 执 行 的 代码 与 10.2 节 
中 讨论 的 伪 代 码 类 似 ， 即 将 数据 从 控制 器 中 的 设备 寄存 器 转移 到 CPU 中 。 类 似 地 ， 高 速 设备 
可 能 是 磁盘 、 扫 描 仪 或 摄像 机 。 对 于 数据 的 传输 ， 高 速 设备 的 设备 驱动 的 执行 情况 与 10.3 市 
中 伪 代 码 的 执行 过 程 类 似 ， 即 创建 DMA 传输 的 描述 符 ， 并 令 与 设备 相关 的 DMA 控制 右 负 责 
执行 。 当 然 ， 设 备 驱 动 需要 兼顾 特定 于 每 个 设备 的 控制 功能 。 很 明显 ， 设 备 控制 器 与 设备 驱 
动 联系 很 紧密 。 
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图 10-9 系统 软件 栈 中 设备 驱动 的 位 置 。 设 备 驱动 作为 操作 系统 的 一 部 分 与 LO 调度 器 进 
AT BCE. 


10.6.1 例子 


举 一 个 更 具体 的 例子 ， 考 虑 云 台 全 方位 (上 下 左右 ) 移动 及 镜头 变 倍 、 变 焦 控 制 (Pan- 
Tilt-Zoom, PTZ) 摄像 机 的 设备 驱动 。 为 了 聚焦 摄像 机 视图 ， 设 备 控制 器 可 以 向 CPU 提供 内 
存 映射 命令 寄存 器 来 指定 控制 功能 ， 如 缩放 级 别 、 移 轴 级 别 、 摄 像 机 前 x-y 坐标 的 空间 。 类 
似 地 ， 控 制 器 提供 摄像 机 开始 和 停止 的 命令 。 除 了 执行 这 些 控制 功能 的 命令 外 ， 控 制 器 也 为 
数据 传输 使 用 DMA 设备 。 表 10-1 对 PTZ 摄像 机 的 设备 控制 器 功能 进行 了 总 结 。 


表 10-1 PTZ 照相 机 控制 器 的 命令 总 结 


命令 控制 器 操作 
a (+O) 将 摄像 机 摇 摄 角度 + O 
移 轴 (+ 口 ) 将 摄像 机 的 位 置 移动 + 口 
缩放 ( +z) 将 摄像 机 焦距 缩放 + z 
开始 开始 摄像 
停止 停止 摄像 
内 存 缓冲 区 (M) 为 传输 到 M 的 数据 设置 内 存 缓冲 区 地 址 
帧 的 数目 (N) 设置 需要 拍摄 和 传人 内 存 的 帧 的 数目 (N) 
使 能 中 断 使 设备 启用 中 断 
禁用 中 断 使 设备 禁用 终端 
开始 DMA 在 摄像 机 中 开始 DMA 数据 传输 


这 类 设备 的 设备 驱动 可 能 包含 如 下 模块 ， 伪 代码 如 下 所 示 : 


// device driver: camera 

// The device driver performs several functions: 
// control camera position; 

// convey DMA parameters; 
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// start/stop data transfer; 

// interrupt _handler; 

ie | error handling and reporting; 

// Control camera position 

camera_position_control (angle pan_angle; angle tilt angle; int z) 


{ 
pan(pan_ angle); 
tilt(tilt_angle); 
zoom( Zz); 

} 


// Set up DMA parameters for data transfer 
camera DMA parameters(address mem_buffer;int num frames) 
{ 

memory buffer(mem buffer) ; 

capture frames(num_ frames) ; 


} 


// Start DMA transfer 
camera start data _transfer() 


{ 
start_camera(); 
start DMA(); 


} 


// Stop DMA transfer 
camera stop data _transfer(); 


{ 
// automatically aborts data transfer 
// if camera is stopped; 
stop_camera(); 

} 


// Enable interrupts from the device 
camera enable interrupt() 
{ 


enable interrupt(); 


} 


// Disable interrupts from the device 
camera disable interrupt() 
{ 

disable interrupt(); 


} 


// Device interrupt handler 
camera_interrupt_handler() 
{ 
// This will be coded similar to any 
// interrupt handler we have seen in 
// Chapter 4. 
// 
// The upshot of interrupt handling may be 
// to deliver "events" to the upper layers 
// of the system software (see Figure 10.9) 
// which may be one of the following: 
// - normal I/O request completion 
// - device errors for the I/O request 
// 


给 出 上 面 关 于 设备 驱动 的 简单 实现 是 想 给 你 信心 ， 让 你 知道 编写 这 样 的 软件 和 与 其 他 的 
编程 作业 类 似 。 我 们 应 该 指出 现代 设备 可 能 要 复杂 得 多 。 例 如 ， 现 代 的 PTZ 摄像 机 可 能 要 与 
摄像 机 本 身 中 的 设备 控制 器 交互 ， 所 以 展现 给 计算 机 的 接口 级 别 更 高 。 类 似 地 ， 摄 像 机 可 以 
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直接 接 入 局 域 网 (我 们 会 在 第 13 章 中 进行 讲解 )， 所 以 通过 使 用 网 络 协议 栈 与 设备 交互 和 在 局 
域 网 中 与 对 等 计算 机 交互 类 似 。 

伪 代 码 表达 的 主要 思想 是 编写 设备 驱动 的 代码 很 容易 。 如 果 你 有 一 定 的 编程 经 验 ， 你 肯 
定 知道 编写 任何 程序 需要 考虑 特殊 情况 〈 例 如 ， 检 查 数组 越界 ) 和 异常 的 处 理 (如 在 系统 调用 
中 检查 返回 的 代码 )。 设 备 驱 动 的 代码 也 是 一 样 的 。 让 设备 驱动 代码 变 得 更 有 趣 或 者 更 有 挑战 
性 取决 于 你 的 态度 ， 你 可 以 考虑 可 能 出 现 的 与 设备 驱动 代码 逻辑 不 相关 的 各 种 情况 。 在 设备 
驱动 代码 中 需要 考虑 一 些 特殊 情况 ， 举 例如 下 : 

1 ) 控制 部 命令 中 的 参数 是 非法 的 〈 例 如 ， 摇 摄 、 移 轴 、 缩 放 和 数据 传输 内 存 地 址 中 的 非 
法 值 )。 

2) 设备 已 经 被 其 他 程序 使 用 。 

3 ) 因为 某 些 原因 设备 没有 做 出 响应 (如 设备 电源 没有 打开 或 设备 出 现 了 故障 等 )。 

由 于 人 为 因素 ， 也 会 出 现 一 些 完 全 意 想不到 的 情况 ， 举 例如 下 : 

1 ) 当 数 据 正在 传输 时 将 设备 从 计算 机 上 拔 出 。 

2) 当 设 备 正 在 传输 数据 时 将 电源 线 从 设备 上 拔 出 。 

3 ) 在 传输 数据 时 发 生 故 障 (比如 ， 有 人 不 小 心 将 摄像 机 碰 倒 等 )。 


10.7 外 围 设备 


历史 上 ,将 WO 设备 划分 为 面向 字符 的 设备 9 和 面向 块 的 设备 。 点 阵 打印 机 、 阴 极 射 线 
终端 (CRT) 和 远程 打印 机 都 是 前 者 的 示例 。 这 些 设备 一 次 输入 /输出 一 个 字符 。 因 为 这 些 设 
备 的 速度 相对 较 慢 ， 所 以 程控 IO (PIO) 是 这 些 设备 和 计算 机 系统 之 间 进 行 数据 传输 的 可 行 
Trike. WERK AA (磁盘 )、CD-RW 和 MP3 播放 需 都 是 面 问 块 的 设备 。 正 如 名 字 所 示 ， 这 些 
设备 在 设备 和 计算 机 系统 之 间 以 数据 块 为 单位 进行 传输 。 例 如 ， 一 旦 激光 打印 机 开始 打印 一 
页 纸 ， 它 会 不 断 地 需要 那 一 页 中 的 数据 ， 因 为 在 打印 页 面 的 过 程 中 没有 办 法 暂停 打印 机 。 对 
于 磁带 驱动 器 也 是 同样 的 道理 ， 一 次 从 磁带 中 读 或 写 一 个 数据 块 。 这 些 设备 的 数据 传输 受 
10.1.1 节 提 及 的 数据 溢出 的 限制 。 所 以 ，DMA 是 处 理 这 种 设备 和 计算 机 系统 之 间 有 效 数 据 传 
输 的 唯一 有 效 方 法 。 | 

K 10-2 对 现代 计算 机 系统 中 的 典型 设备 进行 了 总 结 ， 包 括 数据 传输 速率 (2008 年 前 后 ) 
和 与 DMA 相 比 程控 IO 的 效率 。 第 二 列表 示人 为 因素 是 否 会 影响 设备 的 数据 传输 率 。 类 似 
键盘 和 鼠标 的 设备 与 人 的 速度 类 似 。 例 如 ， 典 型 的 打字 员 的 打字 速率 是 300 ~ 600 字符/ 分 
钟 ， 那 么 键盘 的 输入 速率 就 是 5 ~ 10 字 节 / 秒 。 类 似 地 ,移动 鼠标 的 速率 是 10 ~ 20 事件 / 
秒 ， 即 输入 速率 是 80 ~ 200 字 节 / 秒 。 处 理 器 可 以 使 用 程控 VO ( 轮 询 或 中 断 ) 在 没有 数据 损 
失 的 情况 下 对 这 些 速率 的 设备 进行 处 理 。 在 大 多 数 现代 计算 机 系统 中 都 有 图 形 显 示 ， 图 形 
显示 的 设备 控制 器 中 有 设备 驱动 利用 DMA 传输 进行 更 新 的 帧 缓冲 区 。 对 于 图 像 显 示 ，1 ) 
屏幕 分 辩 率 为 1600 x 1200 ; 2) 屏幕 刷新 率 为 60Hz ; 3) 每 个 像素 24 位 ， 数 据 传输 率 大 于 
300MB/s。 一 张 播 放 1 小 时 的 CPU 载 有 超过 600MB 的 数据 。 一 个 播放 2 小 时 电影 的 DVD $ 
有 超过 4GB 的 数据 。 这 些 技术 都 要 能 够 从 介质 中 以 比 实时 速率 更 快 的 速率 读 取 数据 。 例 如 ， 
CD 以 50 倍 于 实时 播放 的 速率 进行 读 取 ， 而 DVD 以 20 倍 于 实时 播放 的 速率 进行 读 取 ， 数 据 
传输 率 如 表 10-2 所 示 。 注 意 技术 是 不 断 变化 的 。 所 以 这 张 表 是 2008 年 前 后 的 技术 指标 ， 通 
过 该 表 理 解 计算 机 外 围 设备 如 何 与 CPU 进行 交互 。 

O £105 节 ， 我们 在 没有 给 出 正式 定义 的 情况 下 引入 了 术语 面向 字符 (character-oriented) 和 面向 块 (block-oriented)。 
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表 10-2 计算 机 外 围 设备 的 数据 传输 速率 一 览 


a [enpu] Aaea |aeg] PIO | oma 
aa ma | 时 | sima | xw | 

T 

TT fai [= | 200 ssompe | | 
aa (aan) mArwm| 下 | -abs | | ， 
aie (LAN) Arai a | | | ~ 
AMAR mama] a | ia | | ， 
AEN > 
AEFT wa | = | wmm | |> 
E AUHER 

TA wa | e | oom | | 
CD-RW wama] 下 | oos | | > 


以 前 慢 速 的 调制 解 调 器 的 数据 传输 率 是 2400b/s， 这 种 速率 对 带 中 断 的 PIO 或 许 是 适用 的 。 然 而 ， 对 于 支持 
大 于 1Mb/s 的 上 行 数据 传输 率 和 大 于 8Mb/s 的 下 行 数 据 传输 率 的 现代 电缆 调制 解 调 器 而 言 ， 需 要 DMA 传输 

@) 这 意味 着 对 于 文本 喷 墨 打印 机 的 打印 速率 为 20 页 / D4? (pages per min, ppm); 对 于 图 像 ， 为 2-4 ppm. 

@ 喷 墨 打印 技术 允许 在 等 待 从 计算 机 传 入 数据 的 过 程 中 暂停 打印 。 因 为 数据 传输 速率 足够 慢 ， 所 以 该 设备 适合 
使 用 PIO。 

图 这 意味 着 对 于 文本 激光 打印 机 的 打印 速率 为 40 ppm; 对 于 图 像 ， 为 4 ~ 8 ppm. 

@@) 典 型 情况 下 ， 演 讲 者 的 说 话 速率 约 为 120 词 / 分钟。 

@ 感 谢 UT-Austin 的 Yale Patt 和 他 的 同事 ， 感 谢 他 们 对 外 围 设备 速率 所 做 的 工作 。 


10.8 磁盘 存储 希 


磁盘 是 很 重要 的 外 围 设备 ， 我 们 以 磁盘 作为 具体 的 例子 来 进行 学 习 。 和 磁盘 驱动 器 是 科学 技 
术 发 展 的 结果 ， 最 初 是 在 有 磁性 的 线 上 记录 数据 ， 之 后 发 展 为 在 融 有 磁性 涂 层 的 麦 拉 胶囊 上 记 
录 数 据 。 磁 带 只 允许 顺序 访问 所 记录 的 数据 ， 为 了 增加 数据 传输 率 ， 也 为 了 能 够 随机 访问 数据 ， 
逐渐 转变 为 在 转动 的 鼓 状 物 上 记录 数据 。 之 后 进一步 发 展 为 在 带 有 磁性 的 盘 片 上 记录 数据 。 

现代 磁盘 驱动 通常 由 多 个 轻 的 非 铁 磁 性 的 金属 盘 片 构成 ， 盘 片 的 顶层 和 底层 都 涂 有 铁 磁 
性 的 物质 ( 见 图 10-10 )， 这 样 两 个 面 就 都 可 以 用 来 记录 数据 。 通 过 一 个 中 央 主 轴 将 盘 片 连 在 
一 起 ， 并 以 非常 高 的 速率 旋转 (目前 最 先进 的 大 容量 驱动 右 的 转速 为 15 000 RPM 左右 )。 有 
一 个 读 / 写 磁头 (magnetic read/write heads) 陈列 ， 每 面 一 个 ， 磁 头 并 不 会 触 磁盘 面 。 在 磁头 
和 盘面 之 间 有 一 层 细微 的 气 隙 (纳米 级 的 气 阶 ， 比 一 粒 烟尘 还 要 小 )， 人 允许 磁头 在 盘 片 表面 移 
动 ， 不 会 触 碰 表 面 。 如 图 10-10 所 示 ， 每 个 磁头 通过 磁头 辟 与 共用 的 国定 轴 相 连 。 固 定 轴 、 
磁头 辟 和 附属 的 磁头 共同 构成 了 磁头 组 件 (head assembly)。 磁 头 臂 机 械 地 熔接 在 固定 臂 上 ， 
构成 了 单个 对 齐 结构 ， 这 样 所 有 的 磁头 可 以 做 同样 的 移动 ， 整 齐 〈 像 摆动 的 门 ) 地 移入 、 移 出 
磁盘 。 因 此 ， 所 有 磁头 在 相同 的 径 向 位 置 上 的 各 上 自 表 面 上 同时 处 于 同一 位 置 。 

控制 磁头 组 件 运 动 的 执行 器 (actuator) 的 粒度 和 该 技术 允许 的 记录 密度 (recording 
density) 决定 了 在 表面 上 以 磁道 (track) 的 形式 记录 数据 ， 每 个 磁道 都 和 磁盘 中 心 保持 特定 的 
径 向 距离 。 正 如 其 名 ,磁道 是 盘 片上 由 磁性 记录 材料 构成 的 带 状 环形 。 而 且 ， 每 个 磁道 都 是 
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HAR (sector) 构成 的 。 户 区 是 连续 的 多 字 节 构成 的 记录 信息 ， 大 小 固定 ， 构 成 了 磁盘 的 基 
本 记录 单元 ( unit of recording)。 换 句 话 说 ， 扇 区 是 磁盘 能 够 读 或 写 的 最 小 信息 单元 。 磁 盘 外 围 
的 传 感 锅 对 扇 区 进行 划分 ， 所 有 盘 片 对 应 的 磁道 形成 了 还 辑 柱 面 (logical cylinder)( 见 图 10-11 ), 
柱 面 是 由 所 有 盘面 对 应 的 磁道 累加 构成 的 。 我 们 将 柱 面 作 为 逻辑 实体 ， 原 因 在 稍 后 讨论 磁盘 访 
问 所 涉及 的 延迟 和 1O 操作 时 将 会 进行 说 明 。 因 为 即使 最 细微 的 灰尘 落 在 盘 片 表面 也 会 造成 磁 
盘 损 坏 ， 所 以 整个 磁盘 CI. SK EP AAG ait) 是 密封 的 。 


中 央 主 轴 





起 运动 盘 片 ss TVA 
图 10-10 磁盘 


每 个 环 代 表 两 个 磁道 : 
一 个 上 表面 的 磁道 和 
一 个 下 表面 的 磁道 _ 





HEX: 全 部 12 个 表 
HARE X (EDRR 
2 个 磁道 ) 


图 10-11 6 个 盘 片 组 成 的 磁盘 的 逻辑 柱 面 


磁道 是 磁盘 表面 以 盘 心 为 中 心 的 磁带 。 通 常情 况 下 ， 与 内 侧 磁道 相 比 ， 外 侧 的 磁道 圆周 
较 大 。 所 以 外 侧扁 区 和 内 侧扁 区 相 比 所 占 的 面积 也 大 (ILE 10-12a)。 正 如 前 面 所 说 ， 刷 区 
有 固定 的 大 小 来 记录 数据 。 为 了 对 外 侧 磁 道 面积 较 大 但 扁 区 尺寸 固定 的 情况 进行 缓解 ， 早 
期 的 磁盘 技术 采用 了 降低 外 侧 磁道 记录 密度 的 方法 。 这 种 方法 不 能 将 磁盘 的 有 效 空 间 和 完全 
发 挥 出 来 。 


为 了 解决 这 个 无 法 充分 利用 的 问题 ， 现 代 磁 盘 驱 动 器 使 用 了 称 为 区 位 记录 (Zoned Bit 
Recording, ZBR) 的 技术 ，ZBR 使 表面 每 个 扇 区 的 面积 大 体 相 等 。 但 外 侧 磁 道 的 扇 区 比 内 侧 
磁道 的 扇 区 数目 多 ( 见 图 10-12b )。 和 磁盘 表面 分 为 不 同 的 区 ; 不 同 区 的 磁道 有 不 同 数目 的 扇 区 ， 
这 样 就 能 够 更 好 地 利用 。 





a) 普通 ( 非 分 区 ) 记录 方式 b) 分 区 记录 方式 
图 10-12” 非 分 区 和 分 区 记录 方式 的 区 别 9 


假设 
P 是 盘 片 的 数目 ， 
n 是 每 个 盘 片 表面 的 数目 (1 或 2 )， 
1 是 每 个 表面 的 磁道 数 ， 
5 是 每 个 磁道 的 扇 区 数 ， 
b 是 每 个 扇 区 的 字 节 数 。 
假设 采取 非 分 区 记录 结构 ， 磁 盘 的 总 容量 ， 


容量 = (pXnXtXsxb) 字 节 ( 10-1 ) 


采用 分 区 记录 方式 ， 

z 是 分 区 的 数目 ， 

六 是 分 区 z; 上 的 磁道 数目 ， 

Sa 是 分 区 z; 上 每 个 磁道 的 扇 区 数目 。 
采用 分 区 记录 方式 ， 磁 盘 的 总 容量 为 


ARE = (pxXnXx (> (Xs) 1Sisz) Xb) Ft (10-2 ) 


假设 磁盘 驱动 器 有 如 下 配置 : 
。 FARRE 256 字 节 
。 每 个 磁道 12 个 局 区 
。 每 个 表面 有 20 个 磁道 
3 Sat 
a 若 采 用 普通 的 记录 方式 ， 每 个 驱动 器 的 总 容量 是 多 少 字 市 ? 
O KRK.: http://www.pcguide.com/ref/hdd/geom/tracksZBR-c.html. OCharles M. Kozierok/ The PC Guide, 
PCGuide.com. 
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b 老 采 用 分 区 记录 方式 ， 参 数 如 下 : 
。 分 3 个 区 
。 区 3 (最 外 侧 ): 8 个 磁道 ， 每 个 磁道 18 PAE. 
。 区 2: 7 个 磁道 ， 每 个 磁道 14 个 扁 区 。 
。 区 1: 5 个 磁道 ， 每 个 磁道 12 个 遍 区 。 
采取 上 面 的 分 区 记录 方式 ， 了 驱动 器 的 总 容量 是 多 少 ? 
答 : 
a. 总 容量 = 盘 片 数目 X 面 / 盘 片 Xx 磁道 / 面 Xx 遍 区 /磁道 X 字 节 / 遍 区 
=3X2X20X12X256 #4 
= 360KB (K=1024 ) 
cK3NAB=-HHAE X B/HH Xx 区 3 的 磁道 数目 KX RKR/ BBX 字 节 / 遍 区 
=3X2X8X18X 256 
=216KB 
区 2 的 容量 = 盘 片 数目 Xx 面 / 盘 片 Xx 区 2 的 磁道 数目 x RRR BBX F4Y/BE 
=3x2x7X 14x 256 
=147KB 
区 1 的 容量 = 盘 片 数目 X 面 / 盘 片区 1 的 磁道 数目 Xx BRR BB x 字 节 / 遍 区 
=3x2x5x 12256 
= 90KB 
总 容量 = 上 所 有 分 区 的 容量 和 =216 二 147+90 
= 453KB (K=1024 ) 


ZBR 的 一 个 严重 副作用 是 外 侧 与 内 侧 磁 道 的 数据 传输 率 不 同 。 与 内 侧 磁道 相 比 ， 外 侧 磁 
RAR AN K; 磁盘 的 角速度 和 正在 读 的 磁道 无 和 关 ， 都 是 相同 的 。 所 以 ， 与 在 内 侧 磁 道 相 
比 ， 当 磁头 移动 到 外 侧 磁 道 时 每 次 公转 读 出 的 虱 区 数目 也 更 多 。 对 磁盘 进行 空间 分 配 时 ， 倾 
回 于 首先 使 用 外 侧 的 磁道 ， 然 后 再 使 用 内 侧 的 磁道 。 

磁盘 上 特定 数据 块 的 地 址 是 三 元 组 { 柱 面 #， 表 面 #， 忆 区 }。 回 磁盘 读 或 写 数据 需要 
如 下 几 个 步骤 。 第 一 ， 磁 头 组 件 移动 到 特定 的 柱 面 。 完 成 这 个 移动 的 时 间 称 为 寻 道 时 间 (seek 
time)。 我 们 可 以 发 现 寻 找 某 一 特定 柱 面 和 寻找 柱 面 上 的 任何 特定 磁道 的 操作 是 相同 的 ， 因 为 柱 
面 是 与 所 有 表面 ( 见 图 10-11) 相关 磁道 的 逻辑 聚合 。 第 二 ， 磁 盘 需 要 通过 转动 将 要 求 的 户 区 移 
动 到 磁头 的 下 方 。 这 一 时 间 称 为 旋转 延迟 (rotational latency), $=, SAKEA FE, 
从 选中 的 表面 读 取 数 据 并 传送 给 控制 器 ， 这 一 时 间 称 为 数据 传输 时 间 (data transfer time), 

这 三 部 分 构成 了 从 磁盘 谈 / 写 文件 的 总 时 间 ， 其 中 寻 道 时 间 是 最 耗 时 的 部 分 ， 其 次 是 旋 
转 延 迟 ， 最 后 是 数据 传输 时 间 。 和 典型 的 寻 道 时 间 和 平均 旋转 延迟 分 别 为 gms 和 4ms。 这 些 时 
间 很 长 ， 是 由 磁盘 子 系统 的 机 电 特 性 所 决定 的 。 

下 面 介绍 如 何 计算 数据 传输 时 间 。 注 意 磁盘 在 读 / 写 时 不 会 停止 。 就 像 在 VCR 中 当 磁 头 
读 取 数据 并 将 图 像 呈 现在 电视 上 的 同时 ， 磁 带 是 保持 不 停 转动 的 。 当 数据 移动 到 磁头 下 面 时 
磁盘 保持 不 停 地 转动 ， 磁 头 向 表面 读 取 (或 写 人 ) 数据 。 数 据 传输 时 间 可 以 从 旋转 延迟 和 介 
质 的 记录 密度 推导 出 来 。 你 或 许 会 想 读 / 写 介 质 本 身 会 不 会 也 需要 时 间 。 答 案 是 需要 ; 然而 ， 
这 个 时 间 是 电磁 时 间 ， 和 磁盘 旋转 读 取 所 需 扇 区 的 所 有 位 造成 的 延迟 相 比 是 微不足道 的 。 

数据 传输 率 (data transfer rate) 指 当 所 需 的 扇 区 移动 到 读 磁 头 的 下 方 时 ， 单 位 时 间 内 传输 
的 数据 量 。 在 2008 年 前 后 ， 数 据 传 输 率 是 200 ~ 300MB/s。 
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设 
r 是 旋转 速度 ， 单 位 是 每 分 钟 所 转 的 圈 数 (Revolutions Per Minute, RPM), 
s 是 每 个 磁道 的 扇 区 数目 ， 
b 是 每 个 扇 区 的 字 节 数目 ， 
转 一 圈 的 时 间 =60/r 秒 ， 
每 转 一 圈 读 取 的 数据 量 =s x b TT, 
磁盘 的 数据 传输 率 = 磁道 中 的 数据 量 / 转 一 圈 的 时 间 = (s xb) / ( 60/r). 
数据 传输 率 = (sXbxXr) /60B/s ( 10-3 ) 


wit WE oh BO BA eT 
。 HARE 512 FË 
。 每 个 磁道 400 个 遍 区 
。 每 个 表面 6000 个 磁道 
。3 个 盘 片 
。 旋转 速度 为 15 000RPM 
。 普通 记录 方式 
磁盘 的 传输 率 是 多 少 ? 
答 : 
转 一 圈 的 时 间 =1/15 000m=4ms 
磁道 中 的 数据 量 = 每 个 磁道 的 局 区 数 xX 每 个 局 区 的 字 节 数 
=400 x 512 
=204 800 字 节 
因为 磁盘 每 转 一 团 磁 头 读 取 一 个 磁道 ， 所 以 
传输 率 = 每 个 磁道 中 的 数据 /每 次 旋转 的 时 间 
= ( 204 800/4 ) x 1000 字 节 / # 
= 51 200 000 #75 / # 


对 于 特定 请 求 的 查询 时 间 和 旋转 延迟 取决 于 数据 在 磁盘 上 的 具体 位 置 。 一 旦 磁头 移 到 了 
需要 的 扇 区 上 ， 读 / 写 数 据 的 时 间 就 确定 了 ， 由 磁盘 旋转 的 速度 决定 。 为 了 满足 要 求 ， 在 对 
磁盘 驱动 需 的 性 能 进行 估计 时 很 容易 想起 平均 寻 道 时 间 (average seek time) 和 平均 旋转 延 
iR (average rotational latency)。 假 设 请 求 均匀 地 分 布 在 所 有 磁道 上 ， 则 平均 寻 道 时 间 是 查 
找 第 一 个 磁道 和 最 后 一 个 磁道 所 用 时 间 的 平均 值 。 同 样 ， 假 设 请 求 均匀 地 分 布 在 磁道 的 所 
有 扇 区 中 ， 那 么 平均 旋转 延迟 就 是 磁道 中 每 个 鹿 区 的 访问 时 间 的 平均 值 ， 正 好 是 磁盘 旋转 
延迟 的 一 半 。9 

设 

a 是 以 秒 为 单位 的 平均 寻 道 时 间 。 

r 是 磁盘 的 旋转 速度 ， 每 分 钟 转 多 少 转 (RPM). 

s 是 每 个 磁道 的 局 区 数目 。 


We #4 HER =60/r # (10-4 ) 


日 ”在 最 好 情况 下 ， 当 寻 道 成 功 时 所 需 的 扇 区 正好 在 磁头 下 方 ; 最 坏 情 况 下 ， 是 磁头 刚刚 错过 了 所 需 的 扇 区 ， 


需要 等 待 磁盘 旋转 一 周 。 
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平均 旋转 延 识 =(60/(r X 2)) 秒 ( 10-5 ) 
— HERRIE EIT EN, Za a AET E h RAY RPM 决定 。 
AKER = he hk EaR /每 个 磁道 的 遍 区 数目 
局 区 的 读 取 时 间 =(60/ (rxXs)) 秒 ( 10-6 ) 


为 了 随机 读 磁 盘 上 的 户 区 ,磁头 需要 查找 到 特定 的 怖 区 ， 之 后 在 它 读 刷 区 前 需要 等 待 所 
需 的 刷 区 旋转 到 磁头 下 方 。 因 此 ， 随 机 读 一 个 悄 区 由 三 部 分 构成 : 
。 寻 道 时 间 = 平均 寻 道 时 间 = a 秒 
。 AFR KEHE = 平均 旋转 延迟 = ( 60/(r x 2)) 秒 
。 读 一 个 扇 区 的 时 间 = 扇 区 读 取 时 间 = ( 60/(r x s)) 秒 


读 磁 盘 上 的 一 个 随机 遍 区 的 时 间 = 寻 道 时 间 十 将 磁头 移动 到 所 需 扁 区 上 方 的 时 间 
+ Fy Kix Ret E] =at+(60/(r x 2) H(60/(r x s)) 秒 ( 10-7 ) 


Viney 磁盘 驱动 有 如 下 参数 : 
。256 字 节 / AK 
e 12 HX / 磁道 
e 20 磁道 / 面 
。3 盘 片 
。 平均 寻 道 时 间 为 20ms 
。 旋转 速度 为 3600RPM 
。 采用 普通 的 记录 方式 
a. 从 同一 磁道 中 读 取 6 个 连续 的 局 区 的 时 间 是 多 少 ? 
b. 随机 读 取 6 个 遍 区 的 时 间 是 多 少 ? 
es 


EJ 


a. 平均 寻 道 时 间 =20ms 
磁盘 的 旋转 延 识 =1/3600m 


=16.66ms 
P F Wee 4 EGR = ee 4% HEAR /2 
=16.66/2 
读 一 个 遍 区 的 时 间 = 旋转 延迟 /每 个 磁道 的 局 区 数目 
=16.66/12ms 


在 同一 磁道 读 6 个 连续 的 遍 区 ， 所 花费 的 时 间 
= 平均 寻 道 时 间 + 平 均 旋 转 延 忆 + 读 6 个 扇 区 的 时 间 
= 20ms+16.66/2+16.66/2 
= 36.66ms 
b. 对 于 第 二 种 情况 ， 我 们 需要 分 别 计 算 每 次 的 查找 和 读 取 时 间 。 
所 以 ， 读 取 每 个 扁 区 花费 的 时 间 = 平均 寻 道 时 间 十 平均 旋转 延迟 十 读 一 个 局 区 的 时 间 
= 20+16.66/2+16.66/2 
因此 ， 读 6 个 随机 扇 区 的 总 时 间 
= 6 X (20+16.66/2+16.22/12) 
= 178.31ms 


10.8.1 磁盘 技术 的 传奇 故事 


为 了 理解 磁盘 子 系统 的 基本 术语 ， 我 们 一 直 讨论 的 是 简单 情况 。 在 近 二 十 年 里 ， Se 
术 中 的 记录 密度 保持 指数 级 的 增长 。 例 如 ，1980 年 ，20MB 认为 是 很 大 的 磁盘 存储 容量 
时 的 磁盘 有 10 个 盘 片 ， 而 且 很 笨重 。 了 驱动 器 本 身 看 起 来 像 个 洗衣 机 ( 见 图 10-13 ), 并 且 介 z 
A LA M SKA ae AH o 





a) 可 拆 印 介质 b) 磁盘 驱动 
图 10-13 ”磁性 介质 和 磁盘 驱动 9 


2008 年 前 后 ， 台 式 机 的 存储 容量 达到 了 几 百 GB 的 水 平 。 这 样 的 驱动 器 将 介质 集成 在 里 
面 。 同 样 在 2008 年， 台式 机 市 场 出 现 了 小 型 硬盘 (容量 大 概 为 100GB ~ 1TB， 直 径 为 3.5 英 
+), 有 2 ~ 4 个 盘 片 ， 旋 转速 度 约 为 7200RPM， 每 个 表面 的 磁道 数 为 5000 ~ 10 000， 每 个 
磁道 有 几 百 个 局 区 ， 每 个 户 区 为 256 ~ 512 F ( 见 图 10-14 )。 





图 10-14 PC 的 硬盘 驱动 器 ( 2008 年 前 后 ) © 
©Barry Demchak ; 图 10-13b 一 一 美国 明 尼 阿 波 利 斯 市 ， 明 尼 苏 达 大 学 的 查 尔 





昌 图 片 来 源 : 图 10-13a 
斯 ， 巴 贝 奇 研究 所 提供 。 
© Western Digital 硬件 驱动 图 片 : 可 变 的 RPM，1TB 容量 ， 来源: http://www.wdc.com. 由 Western Digital 公 
司 提供 。 
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我 们 提供 了 计算 磁盘 数据 传输 率 的 简单 方法 和 基于 柱 面 — RE — A EY EH nd 
型 ， 这 些 模型 已 经 不 能 满足 现代 技术 的 需要 。 原 因 很 简单 。 本 质 上 ， 磁 盘 与 图 10-14 中 的 相 
同 。 当 然 ， 记 录 密 度 和 RPM 增加 了 ; 驱动 器 中 盘 片 的 尺寸 和 数目 也 显著 增加 了 。 但 这 些 变化 
没有 对 磁盘 访问 和 传输 的 基本 模型 造成 影响 。 真 正 的 变化 在 于 对 如 下 三 方面 进行 了 改进 : SK 
动 硕 电路 、 记 录 技 术 和 接口 。 

第 一 个 改进 在 于 驱动 器 的 内 部 电路 。 简 单 的 模型 假设 磁盘 以 恒定 的 速率 旋转 。 磁 头 移动 
到 要 求 的 磁道 之 后 等 待 所 需 的 扇 区 转动 到 磁头 下 方 。 这 样 很 浪费 能 量 。 所 以 现代 驱动 器 改变 
了 RPM, RPM 取决 于 需要 读 取 的 扇 区 ， 保 证 当 磁 头 组 件 达到 规定 的 磁道 时 所 需 的 扇 区 正好 在 
磁头 下 方 。 

为 一 个 改进 在 于 记录 和 策略。 图 10-15 显示 了 磁盘 表面 的 横 截 图 ， 说 明了 这 一 记录 技术 的 
优势 。 传 统 方 式 采 用 磁化 水 平平 行 的 磁 表 面 介 质 的 方法 来 记录 数据 。 这 一 技术 有 时 称 为 纵向 
(longitudinal) 记录 ( 见 图 10-1Sa)。 最 近 发 明了 新 的 记录 技术 ， 垂 直 磁 记录 (Perpendicular Magnetic 
Recording, PMR)， 正 如 其 名 ， 采 用 磁化 垂直 磁 表 面 介质 的 方法 来 记录 数据 ( 见 图 10-15b)。 关 于 这 
两 种 记录 技术 电子 特性 的 研究 已 经 超出 了 本 书 的 范围 。 这 里 想 让 大 家 明白 这 一 新 技术 极 大 地 增加 
了 磁盘 表面 单位 面积 所 记录 的 数据 密度 。 图 10-15 证 明了 这 一 点 。 可 以 发 现 PMR 使 记录 密度 变 
为 原来 的 2 倍 ， 并 且 对 于 给 定 的 磁盘 规格 ， 存 储 容量 比 纵 回 记录 的 容量 要 大 。 
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图 10-15 磁盘 记录 


现代 驱动 器 的 第 三 个 变化 在 于 将 计算 部 分 设计 在 了 驱动 器 内 部 。 今 天 ， 硬 盘 驱 动 器 提供 
了 与 其 他 系统 进行 连接 的 更 智能 的 接口 。 现 在 再 也 见 不 到 磁盘 控制 絮 在 驱动 外 面 的 结构 了 。 
今天 的 驱动 器 包含 了 控制 器 。 你 也 许 听 说 过 IDE ( Integrated Drive Electronics， 电 子 集成 驱动 
#7), ATA ( Advanced Technology Attachment， 高 级 技术 附件 规格 )、SATA ( Serial Advanced 
Technology Attachment， 叮 行 高 级 技术 附件 ) Al SCSI (Small Computer Systems Interface， 小 
型 计算 机 系统 接口 ) 等 术语 。 这 些 都 是 现代 智能 接口 的 名 字 。 

这 些 高 级 接口 减少 了 CPU 对 磁盘 的 数据 请 求 的 工作 量 。 驱 动 需 的 内 部 有 一 个 微 处 理 希 负 
责 对 逻辑 上 连续 的 块 (在 早期 也 是 物理 上 连续 的 ) 进行 调度 来 获得 对 磁盘 数据 的 最 优 访问 时 
间 。 除 了 微 处 理 器 外 ， 为 了 有 效 处 理 来 自 CPU 的 请 求 ， 驱 动 右 中 还 有 数据 缓冲 区 ， 用 于 提前 
读 入 磁盘 的 扇 区 内 容 。 微 处 理 器 还 保存 了 来 自 CPU 的 内 部 请 求 队 列 ， 为 了 达到 最 优 性 能 ， 会 
对 请 求 队列 重新 进行 排序 。 

磁盘 驱动 器 的 许多 延迟 是 由 读 / 写 操作 涉及 的 机 械 转 动 造成 的 。 关 于 磁盘 机 电 部 分 的 讨 
论 已 经 超出 了 本 书 的 范围 。 我 们 关注 于 系统 软件 如 何 利 用 磁盘 驱动 器 来 对 信息 进行 排序 。 磁 
盘 分 配 策略 应 该 尝试 减少 访问 数据 的 寻 道 时 间 和 旋转 延迟 。 因 为 我 们 知道 寻 道 时 间 是 磁盘 
传输 延迟 中 开销 最 大 的 部 分 ， 所 以 我 们 现在 来 详细 阐述 逻辑 柱 面 的 概念 。 如 果 我 们 需要 保 
存 一 个 可 能 要 占 多 个 磁道 的 大 文件 ， 我 们 应 该 将 文件 分 布 在 同一 面 上 相 邻 的 磁道 (adjacent 
tracks on the same surface)， 还 是 给 定 柱 面相 对 应 的 磁道 (corresponding (same) tracks of a given 
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cylinder) ? 在 现代 磁盘 技术 中 ， 很 难 回答 这 个 问题 。 如 果 使 用 第 一 种 方法 ， 我 们 观察 到 对 于 
给 定 文件 会 有 多 次 寻 道 ; 对 于 第 二 种 方法 ， 观 察 到 对 于 给 定 文件 寻 道 一 次 可 以 查找 文件 的 所 
有 部 分 。 很 容易 看 出 后 者 效果 更 好 。 这 就 是 在 磁盘 子 系统 的 上 下 文 环 境 中 识别 逻辑 柱 面 的 原 
因 。 但 由 于 磁盘 中 盘 片 的 数目 有 限 ， 通 常 为 1 或 2， 所 以 柱 面 概念 的 重要 性 也 减弱 了 。 

文件 系统 是 下 一 章 的 内 容 ， 我 们 在 下 一 章 中 介绍 存储 分 配 策略 。 

从 系统 否 吐 量 的 角度 ,操作 系统 应 该 让 磁盘 以 尽量 降低 旋转 机 制 开销 的 方式 对 操作 进行 
调度 。 在 现代 驱动 带 中 ， 这 种 对 请 求 进行 重新 排序 的 操作 发 生 在 驱动 器 内 部 。 磁 盘 调度 在 下 


一 节 进 行 讨论 。 
10.9 ”磁盘 调度 算法 


磁盘 的 设备 驱动 锅 通 入 了 磁盘 高 效 调度 算法 ， 对 来 自 操作 系统 的 请 求 进行 调度 。 在 第 7 
曹 和 第 8 章 中 我 们 看 到 ， 操 作 系 统 的 内 存 管理 器 为 了 处 理 磁 盘 IO 的 分 页 请 求 可 能 会 发 出 它 
目 己 的 命令 。 我 们 将 在 第 11 章 中 看 到 磁盘 驱动 器 为 终端 用 户 保 存 文件 系统 。 这 样 为 了 响应 用 
户 打 开 、 关 闭 、 读 / 写 文件 等 请 求 ， 操 作 系统 (通过 系统 调用 ) 会 发 出 磁盘 IO 请 求 。 因 此 ,在 
任何 时 间 点 上 ， 磁 盘 的 设备 驱动 器 都 可 能 正在 处 理 一 些 来 自 操作 系统 的 IO 请 求 ( 见 图 10-16 )。 
操作 系统 将 这 些 请 求 按照 生成 时 间 进 行 排序 。 设 备 驱动 器 使 用 磁盘 调度 算法 对 这 些 请 求 进行 
调度 。 除 其 他 事项 外 ， 每 个 请 求 都 会 指定 在 磁盘 上 保存 指定 数据 的 磁道 。 因 为 寻 道 时 间 是 磁 
盘 IO 操作 中 最 耗 时 的 部 分 ， 所 以 磁盘 调度 的 主要 目标 是 减少 寻 道 时 间 。 






request_q 


图 10-16 按照 到 达 时 间 排 序 的 磁盘 请 求 队列 


我 们 首先 假设 单个 磁盘 接收 到 一 系列 的 请 求 ， 并 采取 最 有 效 的 算法 处 理 这 些 请 求 。 之 后 
假设 只 有 一 个 磁头 且 寻 道 时间 和 遍历 的 磁道 数目 成 比例 。 最 后 假设 数据 在 磁盘 上 是 随机 分 布 
的 ， 且 读 和 写 花 费 的 时 间 相 同 。 

比较 不 同 算 法 之 间 差 异 的 典型 度量 是 请 求 的 平均 等 待 时 间 (average waiting time)、 等 待 时 
la] #9 A Z (variance in wait time) 和 总 吞吐 量 (throughput)。 平 均等 待 时 间 和 吞吐 量 是 不 言 自 
明 的 术语 ， 可 以 参见 第 6 章 中 关于 CPU 调度 的 讨论 。 它 们 是 以 系统 性 能 为 中 心 的 度量 指标 。 
从 单个 请 求 的 角度 看 ， 等 待 时 间 的 方差 更 有 意义 。 这 一 度量 指标 告诉 我 们 单个 请 求 的 等 待 时 
间 与 平均 值 之 间 的 偏离 的 大 小 。 与 CPU 调度 类 似 ， 响 应 时 间 (response time)， 或 称 为 周转 时 
间 (turnaround time)， 从 单个 请 求 的 角度 看 ， 是 很 有 意义 的 度量 指标 。 

在 表 10-3 P, h, w 和 e 分别 表 示 对 请 求 i 的 周转 时 间 、 等 待 时 间 和 实际 的 1/O 处 理 器 时 
间 。 大 部 分 指标 和 数学 表达 式 都 与 第 6 章 中 关于 CPU 调度 所 讲 的 内 容 类 似 。 


R 10-3 ”对 性 能 指标 的 总 结 


名 称 描述 
吞吐 量 n/T 任务 / 秒 | 以 系统 为 考虑 中 心 ， 度量 在 时 间 7 内 处 理 n 个 1 
平均 周转 时 间 (4) 以 系统 为 考虑 中 心 ， 度 量 任务 的 平均 完成 时 间 


平均 等 待 时 间 (ws) |( etet +(t,-€,) ) / 


nn 或 者 (wiwit +w,) /n 





秒 以 系统 为 考虑 中 心 ， 度量 IO 请 求 所 经 历 的 平均 
等 待 时 间 
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(5È) 


名 称 iti 


响应 时 间 / 周转 时 间 一 以 用 户 为 考虑 中 心 ， 度 量 特定 1/0 请 求 i 的 周转 


时 间 
响应 时 间 的 方差 E(t-tevg 以 用 户 为 考虑 中 心 ， 度量 IO 请 求 i 的 实际 响应 


时 间 (4) 与 期 望 值 a) 的 统计 方差 


等 待 时 间 的 方差 E[(w-w 以 用 户 为 考虑 中 心 ， 度 量 IO 请 求 i 的 实际 等 待 
时 间 Cw) 与 期 望 值 (w,,,) 的 统计 方差 
饥饿 状态 -一 以 用 户 为 考虑 中 心 ， 因 为 有 些 IO 调度 器 的 内 在 


特性 对 特定 IO 请求 或 一 组 IO 请 求 表示 拒绝 服务 
我 们 重新 复习 磁盘 调度 的 5 种 不 同 算法 。 为 了 使 讨论 更 简单 、 更 具体 ， 我 们 假设 磁盘 有 
200 个 磁道 ， 标 号 为 0 ~ 199 (0 是 最 外 层 的 磁道 ，199 是 最 内 层 的 磁道 ) 。 磁 头 完 全 收回 的 位 
置 是 磁道 0。 当 磁头 组 件 处 在 磁道 199 时 就 达到 了 它 的 最 远 跨 度 。 
你 会 发 现 这 些 磁盘 调度 算法 与 第 6 章 中 的 CPU 调度 算法 类 似 。 


10.9.1 先 到 先 服务 


正如 名 字 所 示 ， 算 法 按照 请 求 的 到 达 时 间 来 进行 服务 。 
从 这 一 点 上 说 ， 它 和 CPU 调度 策略 的 FCFS 算法 类 似 。 这 个 
算法 有 一 个 很 好 的 特性 ， 不 论 IO 请 求 的 是 哪个 磁道 ， 等 待 时 
间 的 方差 最 小 。 但 这 是 唯一 的 优点 。 从 系统 的 角度 看 ， 对 于 
大 多 数 工作 负载 ， 这 个 算法 会 导致 较 差 的 吞吐 量 。 图 10-17 说 
明了 磁头 如 何 按照 FCFS 调度 策略 在 盘面 来 回 移动 处 理 请 求 ， 
特别 是 当 FCFS 的 请 求 要 访问 距离 很 远 的 磁道 时 。 





10.9.2 ”最短 寻 道 时 间 优 先 


这 种 调度 策略 和 SJF 处 理 器 的 调度 策略 类 似 。 基 本 思 。 图 10.17 FCFS 的 磁 半 的 移动 
想 是 优先 处 理 那 些 离 磁 头 位 置 最 近 磁 道上 的 任务 ( 见 图 10- 
8 )。 正 如 SIF 用 于 处 理 吉 调 度 一 样 ， 对 于 特定 的 一 组 请 求 ， 
最 短 寻 道 时 间 优 先 (SSTF, Shortest Seek Time First) 会 保证 
有 最 小 的 平均 等 待 时 间 并 输出 较 好 的 结果 。 然 而 ， 和 SIF 类 
似 ， 因 为 请 求 可 能 与 正在 处 理 的 大 量 请 求 的 距离 较 远 ， 所 以 
SSTF 有 可 能 出 现 饥饿 请 求 。 和 FCFS 相 比 ， 这 个 调度 策略 的 
方差 较 大 。 


10.9.3 SCAN 


这 个 算法 和 磁头 组 件 的 机 电 特 性 相符 合 。 基 本 思想 如 下 : 
磁头 从 当前 位 置 (磁道 0 ) 向 最 内 层 磁 道 (磁道 199 ) 移动 。 随 着 磁头 的 移动 ， 在 从 最 外 层 磁 
道 向 最 内 层 磁 道 移动 的 过 程 中 ， 算 法 不 考虑 到 达 时 间 ， 处 理 途 中 遇 到 的 请 求 。 一 旦 磁头 到 达 
了 最 内 层 磁道 ， 它 就 反 向 向 最 外 层 磁道 移动 ， 并 人 处理 途中 过 到 的 请 求 。 只 要 请 求 队列 不 为 空 ， 
算法 就 会 不 断 重复 这 个 过 程 。 图 10-19 展示 了 这 个 算法 的 思想 。 





图 10-18 SSTF 策略 磁头 的 移动 


453 


454 


306 #10 F 


最 外 层 磁 道 最 内 层 磁道 





图 10-19 SCAN 算法 磁头 的 移动 


FPR tl, t2, t3 和 女 在 磁头 向 前 移动 时 就 已 存在 (如 图 10-16 所 示 )。 在 磁头 到 达 最 内 
层 磁 道 之 后 出 现 了 请 求全 和 t6 ( 按 顺 序 出 现 )。 算 法 按照 磁头 反 回 遍历 的 顺序 处 理 这 些 请 求 。 
在 等 电梯 时 应 该 知道 都 发 生 了 什么 ， 这 个 算法 处 理 请 求 时 就 像 等 电梯 ， 所 以 SCAN 算法 经 党 
称 为 电梯 (Elevator) 算法 。 和 SSTF 相 比 ，SCAN 算法 等 待 时 间 的 方差 较 小 ， 平均 等待 时 间 
与 SSTF 类 似 。 与 SSTF AW, SCAN 算法 并 不 保存 请 求 的 到 达 顺 序 。 然 而 ， 和 SSTF 相 比 ， 
SCAN 算法 有 一 个 根本 区 别 ，SSTF 可 能 随机 地 让 某 个 给 定 进程 处 于 饥饿 状态 。 另 一 方面 ， 
SCAN 算法 违反 先 来 先 服务 的 公平 特性 是 有 上 界 的 。 上 界 是 磁头 从 一 端 移动 到 另 一 端的 移动 
时 间 。 所 以 SCAN 算法 也 避免 了 请 求 出 现 饥 饿 的 状态 。 


10.9.4 C-SCAN 


循环 扫描 (C-SCAN, Circular Scan) 是 SCAN 算法 的 变形 ， 算 法 将 磁盘 表面 看 成 逻辑 的 
圆 。 所 以 一 旦 磁头 到 达 了 最 内 层 的 磁道 ， 算 法 就 会 将 磁头 组 件 移动 到 男 一 侧 ， 并 重新 进行 扫 
描 。 换 句 话 说 ,算法 在 磁头 反 向 移动 过 程 中 并 不 处 理 任何 请 求 。 如 图 10-20 所 示 ， 对 SCAN 
算法 中 出 现 的 同样 请 求 ， 形 象 地 进行 了 说 明 。 


最 外 层 磁 道 最 内 层 磁 道 





图 10-20 C-SCAN 算法 磁头 的 移动 
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通过 忽略 反 癌 运动 所 遇 到 的 请 求 ，C-SCAN 消除 了 对 SCAN 算法 中 磁盘 中 间 磁 道 对 大 量 
请 求 进行 处 理 的 不 公平 方法 。 这 个 算法 减少 了 处 理 请 求 时 的 不 公平 性 (注意 它 是 如 何 处 理 15 
和 t6 AY), JF ALAN SCAN 算法 相 比 ， 它 降低 了 等 待 时 间 的 方差 。 


10.9.5 LOOK 和 C-LOOK 


这 两 个 策略 与 SCAN 算法 和 C-SCAN 算法 类 似 ， 但 当 磁 头 移动 方向 上 没有 请 求 时 磁头 
组 件 会 立即 改变 移动 方向 。 即 磁头 组 件 不 会 不 必要 地 移动 到 最 外 侧 或 最 内 层 。 移 动 策略 与 电 
梯 工 作 方 式 类 似 。 因 为 避免 了 不 必要 的 机 械 运 动 ， 所 以 这 些 算法 比 SCAN 算法 和 C-SCAN 
算法 要 好 。 即 使 这 样 ， 历 史上 还 是 将 SCAN 算法 称 为 电梯 算法 ，LOOK 算法 和 大 多 数 现代 
电梯 系统 的 服务 模式 类 似 。 图 10-21 显示 了 LOOK 算法 和 C-LOOK 算法 处 理 SCAN 算法 和 
C-SCAN 算法 例子 中 出 现 的 请 求 序列 。 注 意 磁头 在 处 理 后 面 的 未 完成 序列 时 的 位 置 变 化 。 当 
没有 需要 处 理 的 请 求 时 ， 磁 头 会 停 在 最 后 处 理 的 请 求 位 置 。 这 就 是 LOOK 算法 与 SCAN 算 
法 ，C-LOOK 算法 与 C-SCAN 算法 的 主要 区 别 。 


最 外 层 磁 道 最 内 层 磁道 





b) C-LOOK 


图 10-21 LOOK A C-LOOK 算法 磁头 的 移动 


10.9.6 ”磁盘 调度 总 结 
调度 算法 的 选择 取决 于 很 多 因素 ， 包 括 预期 的 布局 、 存 储 分 配 策略 和 磁盘 驱动 右 的 机 电 
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特性 。 通 常情 况 下 ， 位 盘 调 度 使 用 LOOK 算法 和 C-LOOK 算法 的 变形 。 我 们 介绍 其 他 的 算法 
是 为 了 更 好 地 进行 讨论 ， 而 不 是 在 实际 系统 中 将 它们 作为 可 选用 的 方案 。 

正如 我 们 在 10.8.1 PHB AY, PUREE Koa le] CPU 提供 非常 复杂 的 接口 。 这 样 ， 驱 
动 器 上 块 的 内 部 布局 对 于 磁盘 设备 驱动 器 甚至 是 不 可 见 的 ， 它 是 操作 系统 的 一 部 分 。 假 设 接 
口 允 许 出 现 来 自 设备 驱动 器 的 多 个 未 完成 的 请 求 ， 那 么 控制 器 本 身 会 对 前 述 磁盘 调度 算法 进 
行 具体 应 用 。 

例 10-4 说 明了 各 种 调度 算法 之 间 的 区 别 。 


有 如 下 情况 : 


磁盘 总 的 柱 面 数目 =200 (标号 为 0 ~ 199) 

当前 磁头 位 置 = 柱 面 23 

当前 请 求 的 到 达 序 列 =20,17,55,35,25,78,99 
给 出 对 于 上 述 请 求 不 同 磁盘 调度 算法 的 调度 结果 。 

a, 


A. 


a. 对 于 给 定 请 求 使 用 C-LOOK 算法 的 调度 安排 : 
25,35,55,78,99,17,20 

b. SSTF 算法 的 调度 安排 : 
25,20,17,35,55,78,99 

c. LOOK 算法 的 调度 安排 : 
25,35,55,78,99,20,17 

d. SCAN 算法 的 调度 安排 : 
25,35,55,78,99,199,20,17,0 

e. FCFS 算法 的 调度 安排 : 
20,17,55,35,25,78,99 

f. C-SCAN 算法 的 调度 安排 : 
25,35,55,78,99,199,0,17,20 


10.9.7 算法 比较 


我 们 还 用 例 10-4 中 的 请 求 序列 来 比较 算法 的 不 同 。 按 照 到 达 顺 序 ， 我们 有 7 个 请 求 : 
(FETA 20 )、R2 ( 柱 面 17 )、R3 ( 柱 面 55 )、R4 ( 柱 面 35 )、R5 ( 柱 面 25 ).R6 ( 柱 面 78 ) 和 R7 he 
面 99 ). 

我 们 关注 请 求 R1。 我 们 选择 经 历 的 磁道 数 作为 比较 分 析 的 响应 时 间 。 因 为 上 例 中 磁头 开 
始 的 位 置 是 23， 所 以 不 同 算法 对 R1 的 啊 应 时 间 为 

© T “=3 ( 先 处 理 RI). 

© 7,°"=7 ( 先 处 理 R5， 之 后 处 理 Rl )。 

。7T. “=355 (磁头 运动 轨迹 按照 例 10-4 PRI (d) 来 进行 计算 )。 

© TcSCAN=395 (磁头 运动 轨迹 按照 例 10-4 中 的 (£) 来 进行 计算 )。 

e 710% =155 (磁头 运动 轨迹 按照 例 10-4 中 的 Ce) 来 进行 计算 )。 

© Tr00K]61 (磁头 运动 轨迹 按照 例 10-4 中 的 (a) 来 进行 计算 )。 

K 10-4 对 例 10-4 的 访问 序列 在 不 同 磁盘 调度 算法 (FCFS, SSTF 和 LOOK) 下 的 啊 应 时 
间 进 行 了 对 比 (以 磁头 的 移动 为 单元 )。 


TERENA TE MA TR AC H SAEIA FERAT S A eA AY EL 

e FCFS=7/148=0.047 请 求 / 磁道 

© SSTF=7/92=0.076 请 求 / 磁道 

。LOOK=7/158=0.044 请 求 / 磁道 

从 前 面 的 分 析 中 可 以 看 出 ，SSTF 在 平均 响应 时 间 和 吞吐 量 方面 表现 得 最 好 。 但 这 是 以 
公平 性 为 代价 的 (在 SSTF 列 中 将 RS 的 响应 时 间 与 早先 的 请 求 R1 ~ R4 进行 对 比 )。 而 且 ， 
SSTF 有 可 能 出 现 饥 饿 状态 。 乍 一 看 ，LOOK 算法 在 表 中 的 响应 时 间 最 坏 。 然 而 ， 还 有 几 点 需 
要 注意 。 第 一 ， 啊 应 时 间 对 磁头 的 初始 位 置 和 请 求 的 分 布 情况 很 敏感 。 第 二 ， 有 可 能 选取 的 
样 例 是 病态 的 〈 或 者 说 ， 是 不 合适 的 )， 正 好 适合 某 个 特定 算法 。 第 三 ， 在 这 个 预先 制定 好 的 
例子 中 ， 请 求 序列 在 处 理 过 程 中 不 发 生变 化 。 实 际 中 ， 新 的 请 求 可 能 会 加 入 队列 中 ， 并 对 吞 
吐 量 和 啊 应 时 间 造 成 影响 〈 见 练习 题 13 ) 。 


R 10-4 $i) 10-4 调度 算法 的 定量 比较 


on 响应 时 间 

EA E 
eamm | = | v | 
3 ES 32 
RA (机 2 
R6 ( 柱 面 78 ) 71 55 
R7 (FETI 99 ) 148 76 
平均 值 66.4 70 


总 体 上 看 ， 如 果 请 求 均匀 地 分 布 在 磁盘 上 ， 那 么 LOOK 的 平均 响应 时 间接 近 SSTF 的 平 . 


均 响 应 时 间 。 更 重要 的 是 ， 表 中 没有 反映 出 FCFS 和 SSTF 内 在 地 改变 磁头 组 件 方向 所 花费 的 
时 间 和 能 量 。 这 可 能 是 将 LOOK 作为 更 好 的 磁盘 调度 选择 的 最 重要 的 考虑 因素 。 

利用 表 10-3 中 总 结 的 公式 ， 读 者 通过 例 10-4 的 练习 可 以 很 好 地 将 所 有 磁盘 调度 算法 进行 
比较 。 

经 过 多 年 发 展 ， 磁 盘 调度 算法 已 经 得 到 了 广泛 的 研究 。 正 如 我 们 早先 所 观察 到 的 〈 见 
10.8.1 节 )， 磁 盘 驱 动 技术 的 发 展 很 快 。 正 因为 这 些 发 展 ， 所 以 对 于 每 种 新 的 磁盘 ， 迫 切 需要 对 
磁盘 调度 算法 进行 重新 评估 。9 目 前 有 些 LOOK 算法 的 变种 证 明 它 是 所 有 选择 中 性 能 最 好 的 。 


10.10 固态 硬盘 


硬盘 技术 的 一 个 基本 限制 是 它 的 机 电 特 性 。 经 过 多 年 发 展 ， 一 些 新 的 存储 技术 出 现 了 和 蔡 
换 磁 盘 作 为 存储 的 趋势 ， 但 目前 还 没有 实现 。 主 要 原因 是 ， 和 这 些 新 技术 相 比 ， 磁 盘存 储 每 
字 节 的 价格 较为 低廉 。 

威胁 硬盘 相对 垄断 地 位 的 技术 是 固态 硬盘 ( Solid State Drive，SSD)。 这 项 技术 的 起 源 可 
以 追溯 到 电 可 擦 可 编程 只 读 存 储 器 (Electrically Erasable Programmable Read-Only Memory, 
EEPROM). 在 第 3 章 中 , 我 们 引入 了 ROM 作为 一 种 内 容 为 非 易 失 性 (nonvolatile) 的 固态 内 


O Wil, http://www.ece.cum.edu/~ganger/papers/sigmetrics94.pdf. 
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存 ， 即 在 供电 周期 中 内 容 是 保持 不 变 的 。 EP see oe 你 应 该 见 过 转 
‘OL, UA 10-22 所 示 。 —BSeRLSTI, AW og 

(图 的 底部 ) 仍然 保持 连接 所 选 的 分 又 。ROM 也 是 以 同 
样 的 方式 工作 。 

图 10-23 描述 了 一 个 简单 的 类 似 转 略 机 的 电子 部 
件 。 如 果 图 中 间 的 开关 打开 ， 那么 输出 就 是 1 ; 否则 ， 
输出 就 是 0。 这 就 是 ROM 的 基本 构件 。 开 关 通 过 基本 
的 逻辑 门 实现 (NAND 或 NOR)。 将 这 些 开关 封装 在 
集成 电路 的 内 部 就 是 ROM. 根据 期 望 的 输 出 。 开 关 可 
编程 输出 0 或 1。 这 就 是 电路 称 为 可 编程 只 读 存 储 器 
(Programmable Read-Only Memory, PROM) 的 原因 。 ca 

这 项 技术 之 后 又 有 了 新 的 发 展 ， 将 ROM 中 的 位 模 l 
式 改 为 电 可 擦 除 和 可 编程 的 ， 这 样 就 可 以 包含 不 同位 的 m 
位 模式 。 这 就 是 EEPROM 技术 。 虽 然 这 项 技术 和 RAM 
的 特性 非常 相似 ， 但 它们 有 很 大 的 区 别 。RAM 中 的 
读 / 写 粒度 是 可 选 的 。 = “een 技术 的 电子 特性 ， 

EEPROM 中 的 擦 除 每 次 会 对 一 个 块 中 所 有 的 位 进行 擦 

除 操作 。 与 RAM iri 这 样 的 写 要 花费 几 

个 数量 级 以 上 的 时 间 。 所 以 EEPROM 不 能 取代 DRAM aes Ses 

技术 。 然 而 ， 这 项 称 为 闪存 (flash memory) 的 技术 可 以 用 在 便携 式 记 忆 卡 上 上， 并 且 可 以 作为 
APTA FLA iPod 中 。 

还 有 一 个 问题 可 能 会 困扰 你 ， 你 可 能 会 想 为 什么 闪存 没有 替代 台式 机 和 笔记 本 电脑 中 的 
磁盘 作为 永久 性 存储 。 毕竟 作为 完全 的 固定 状态 ， 这 项 技术 没有 磁盘 技术 的 内 在 问题 (由 于 
磁盘 的 机 电 特 性 延缓 了 数据 的 访问 时 间 )。 

便 盘 在 三 个 方面 仍然 具有 优势 : 较 高 的 存储 密度 (导致 每 字 节 的 价格 较 低 )、 较 高 的 读 / 
写 带 宽 和 更 长 的 寿命 。 最 后 一 点 需要 进行 说 明 ，SSD 技术 本 身 也 有 内 在 限制 : 存储 的 每 个 给 
定 区 域 只 能 重 写 特定 的 次 数 。 这 意味 着 对 同一 块 进行 频繁 地 写 操作 会 导致 不 均匀 的 磨损 ， 这 
样 也 缩短 了 存储 作为 整体 的 寿命 。 通 和 常 ，SSD 的 生产 商 采 用 损耗 均衡 (wear leveling) 技术 来 
避免 这 一 问题 。 损 耗 均 衡 的 目的 是 为 了 将 频繁 写 和 的 块 重新 布局 在 存储 的 不 同 区 域 里 。 相 对 
于 普通 存储 系统 的 工作 负载 ， 这 增加 了 额外 的 读 / 写 周期 。 

SSD 技术 仍然 在 不 断 发 展 ， 弥 补 这 些 不 足 。 例 如 ，2008 年 前 后 ,市场 上 出 现 了 容量 为 
100GB、 传 输 率 为 100MB/s 的 SSD 设备 。 对 于 笔记 本 电脑 中 存储 要 求 不 高 的 领域 ， 有 些 生产 
商 也 将 SSD 作为 大 容量 存储 。 但 是 ，2010 年 前 后 ， 基 于 SSD 的 大 容量 存储 的 价格 仍 明 显 高 
于 对 应 的 基于 磁盘 的 大 容量 存储 的 价格 。 


10.11 VO 总 线 和 设备 驱动 的 演化 


从 PC 出 现 的 那 一 刻 起 就 一 直 有 将 外 围 设 备 与 计算 机 进行 连接 的 需求 。 虽 然 表 10-4 显示 
了 设备 对 CPU 的 影响 ， 但 很 少 出 现 设 备 直 接 与 CPU 连接 的 情况 。 这 是 因为 外 围 设 备 是 由 第 
三 方 供应 商 制 造 的 。5 第 三 方 供应 商 (比如 ， 生 产 磁 盘 的 Seagate 和 生产 摄像 机 的 Axis) 有 别 


龟 ” 我 们 已 经 介绍 了 这 个 术语 ， 但 在 10.4 节 没 有 定义 它 。 
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F IBM, Dell 和 Apple 等 计算 机 生产 商 ， 它 们 生产 外 围 设备 和 与 外 围 设备 配套 的 设备 驱动 器 。 
这 些 第 三 方 供 应 商 并 不 知道 使 用 这 些 设备 的 计算 机 的 内 部 信息 ， 所 以 将 设备 设计 成 能 够 连接 
任何 生产 商 生 产 的 计算 机 。 你 可 能 听 说 过 即 插 即 用 (plug and play) 的 概念 ， 这 意味 着 外 围 
设备 能 够 在 不 改变 计算 机 任何 内 部 构造 的 情况 下 与 计算 机 系统 进行 连接 。 这 一 特性 就 是 发 展 
10.4 方 中 PCI 等 标准 的 主要 原因 。 

现代 计算 机 爱好 者 一 定 都 听 过 类 似 USB 和 火线 (Firewire) 的 术语 。 让 我 来 解释 这 些 术 语 
都 是 什么 意思 。 正 如 我 们 在 10.4 节 中 所 提 ，PCI 总 线 是 使 用 地 址 、 数 据 和 命令 多 路 复 用 的 32 
位 并 行 总 线 。USB 的 意思 是 通用 串 行 总 线 (Universal Serial Bus, USB), USB 和 火线 是 外 围 
设备 与 计算 机 之 间 串 行 接口 的 两 个 有 竞争 性 的 标准 。 你 可 能 会 想 ， 既 然 并 行 接口 更 快 ， 为 什 
么 要 使 用 串 行 接口 与 计算 机 连接 。 实 际 上 ， 如 果 我 们 回顾 历史 ， 就 会 发 现 只 有 慢 速 的 面向 字 
符 的 设备 (例如 ， 阴 极 射 线 管 ,或 称 为 CRT， 通常 称 为 哑 终 端 ) 与 计算 机 系统 进行 串 行 连接 。 

你 知道 信号 在 信和 号 线 上 的 传输 最 终 受 到 光速 限制 。 而 实际 的 数据 传输 率 ， 如 表 10-2 所 
示 ， 现 在 接近 这 个 速率 。 电 子 线路 的 延迟 是 单一 线路 更 快 传输 数据 的 主要 限制 因素 。 并 行 化 
有 助 于 打破 这 一 限制 ， 通 过 在 并 行 线路 上 传输 数据 提高 总 体 的 吞吐 量 。 然 而 ， 随 着 技术 的 提 
高 ， 线 路 的 延迟 也 减少 了 ， 也 可 以 有 更 高 的 信号 产生 频率 。 在 这 种 情况 下 ， 串 行 接 口 的 优势 
比 并 行 接口 大 。 首 先 ， 由 于 减少 了 线路 和 连接 器 的 数目 ， 所 以 会 更 小 更 便宜 。 其 次 ,并行 接 
口 在 速率 较 高 时 ， 如 果 没 有 对 并 行 线路 进行 有 效 的 防护 ， 会 发 生 串 扰 。 另 一 方面 ， 通 过 有 效 
的 波形 整形 和 滤波 技术 ， 很 容易 在 较 高 频率 下 操作 串 行 信号 。 这 也 是 现在 串 行 接口 实际 上 比 
并 行 接口 速度 更 快 的 原因 。 

所 以 ,将 高 速 设备 与 计算 机 系统 串 行 相连 成 了 标准 。 这 就 是 发 展 诸如 USB 和 火线 标准 用 
于 将 外 围 设备 与 计算 机 系统 进行 连接 的 原因 。 因 此 ， 你 可 能 注意 到 大 多 数 现代 笔记 本 电脑 不 
支持 任何 并 行 接口 。2007 年 ， 即 使 是 并 行 打印 机 接口 也 从 笔记 本 电脑 上 消失 了 。 串 行 接口 标 
准 增强 了 现代 外 围 设备 的 即 插 即 用 特性 。 

你 可 能 会 好 奇 对 于 串 行 接口 为 什么 会 有 两 个 有 竞争 性 的 标准 。 这 又 是 因为 不 同 的 计算 
机 生产 商都 想 占 据 更 多 的 市 场 份额 。Microsoft 和 Intel 提倡 USB, Apple 公司 提倡 火线 。 今 
天 ， 这 两 个 串 行 接口 都 成 为 了 用 于 连接 慢 速 和 快速 外 围 设 备 的 工业 标准 。USB 1.0 能 够 达 
到 1.5MB/s 的 数据 传输 率 ， 通 常用 于 对 键盘 和 鼠标 等 慢 速 IO 设备 进行 连接 。 火 线 能 够 支持 
100MB/s 的 速率 ， 通 常用 于 类 似 电 子 摄像 机 等 的 多 媒体 高 增值 电子 设备 。USB 2.0 支持 的 速 
率 可 达 60MB/s， 所 以 火线 和 USB 之 间 的 区 别 变 得 有 些 模糊 了 。 

为 了 完成 VO 总 线 的 讨论 ， 我 们 还 需 注意 另外 两 项 针对 PC 产业 IO 体系 结构 的 增强 技 
术 。 高 级 图 形 接 口 Advanced Graphics Port，AGP )， 是 连接 3D 图 形 控制 闫 和 主板 的 专用 通 
道 。 对 于 3D 图 形 处 理 ， 在 PCI 总 线 上 与 其 他 设备 共享 带宽 是 不 够 的 ， 特 别 是 对 于 可 交互 的 
游戏 。 对 3D 图 形 处 理 更 高 带宽 的 需求 促成 了 AGP 通道 的 发 展 。 最 近 ，AGP 很 大 程度 上 被 
PCI Express (PCI-e) 取代 ， 这 是 另 一 个 新 的 提供 主板 和 图 形 控制 器 之 间 连 接 的 标准 。 这 些 标 
准 更 详细 的 电子 特性 和 差异 超出 了 本 书 的 范围 。 


10.11.1 设备 驱动 的 动态 负载 


设备 是 即 插 即 用 的 ， 所 以 用 设备 驱动 来 控制 它们 。 考 虑 数字 摄像 机 的 设备 驱动 。 设 备 驱 
动 不 需 要 一 直 作 为 系统 软件 的 一 部 分 ( 见 图 10-9 )。 在 Linux 和 Mircrosoft Vista 等 操作 系统 
中 ， 当 相关 设备 上 线 时 ,设备 驱动 动态 地 链接 到 系统 软件 。 当 设备 接 入 时 操作 系统 通过 设备 
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中 断 识别 新 设备 (例如 ， 当 你 将 摄像 机 或 快速 记忆 棒 插入 USB 接口 时 )。 操 作 系统 查找 设备 
列表 并 识别 刚 接 人 系统 的 设备 (大 多 数 情况 下 ， 设 备 供应 商 和 开发 设备 驱动 的 操作 系统 供应 
商 是 有 合作 的 )。 之 后 为 了 控制 设备 将 设备 驱动 动态 链接 并 装 人 内 存 中 。 当 然 ， 如 果 接 人 的 设 
备 没 有 合适 的 驱动 ,那么 操作 系统 只 能 让 用 户 提 供 新 接 人 系统 设备 的 驱动 。 


10.11.2 信息 汇总 


随 奢 计算 机 系统 高 级 接口 的 出 现 ， 高速 设备 和 低速 设备 变 得 离 CPU 本 身 的 距离 越 来 越 
远 。 所 以 程控 VO 几乎 成 为 过 去 。 在 10.5 市 中 ,我 们 提 到 了 IBM 在 20 世纪 60 年 代 和 70 年 
代 提 出 了 关于 大 型 机 IO 处 理 融 的 创新 。 现 在 这 些 概念 已 经 体现 在 了 你 的 计算 机 中 。 

主板 ( motherboard) 是 PC 时 代 出 现 的 术语 ， 它 意味 着 中 央 计 算 机 系统 电路 的 出 现 。 它 是 
单个 印刷 电路 板 ， 包 含 处 理 器 、 内 存 系 统 (包括 内 存 控制 器 ) 和 用 于 连接 外 围 设 备 与 CPU 的 
IO 控制 项 。 主 板 名 字 的 由 来 是 因为 印刷 电路 板 上 有 许多 捅 梭 ， 这 些 择 权 (通常 称 为 子 卡 ) 可 
以 通过 插入 设备 来 对 计算 机 系统 进行 扩充 。 例 如 ， 物 理 内 存 的 扩充 就 是 通过 这 种 方式 实现 的 。 
图 10-24 是 现代 主板 的 示意 图 。 图 中 很 清楚 地 表示 了 组 件 和 它们 的 特性 。 你 可 以 看 到 能 够 插 
入 外 围 设备 控制 器 子 卡 的 插 槽 和 插入 DIMMS ( 见 第 9 章 关 于 DIMMS 的 讨论 ) 的 插 槽 。 
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图 10-24 主板 图 片 (ASRock K7VT4A Pro) 9 


图 10-25 显示 了 现代 主板 中 重要 电路 单元 的 框图 。 理 解 这 些 单元 很 重要 。 每 个 计算 机 系 
统 都 需要 在 上 电 时 自动 执行 一 些 低 级 代码 。 正 如 我 们 所 知 ， 处 理 器 只 是 简单 地 执行 指令 。 关 
键 是 将 计算 机 系统 引入 操作 系统 对 全 部 资源 进行 控制 的 状态 。 你 可 能 听 说 过 启动 (booting 
up) 操作 系统 这 个 术语 。 该 术语 是 通过 引导 程序 ( bootstrapping) 的 简称 ， 瞳 指 通过 目 己 的 程 
序 进 行 启 动 。 当 上 电 时 ， 处 理 器 自动 执行 只 读 存 储 器 (Read-Only Memory, ROM) 中 已 知 固 
定位 置 的 引导 程序 。 代 码 会 完成 系统 所 有 的 初始 化 操作 ， 包 括 在 将 控制 转移 至 图 10-9 中 的 系 


© AUR: http://en.wikibooks.org/wike/File:ASRock K7VT4A_Pro_Mainboard_Labeled_English .svg 
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统 软件 的 上 层 前 识别 外 围 设备 。 在 PC 中 ， 引 导 程 序 代码 称 为 BIOS， 是 基本 输入 /输出 系统 
(Basic Input/Output System 的 简称 )。 


CPU 


图 形 卡 插 模 | 时 钟 | 前 端 总 线 
RERS on 


RRENA ais x non ae _— 
AGP BK PCI : 
express ) : 北桥 : page 
| (内 存 控制 器 上 

: 集线器 ) | 





PCI 总 线 





Io EI 
: | 音频 编 解 码 器 上 4 
PCI fff _ | CMOS 存储 上 上 pili 


闪存 ROM 
(BIOS) 





图 10-25 ”典型 主板 的 框图 


关于 图 10-25， 有 以 下 几 点 值得 注意 : 

© 标 有 北桥 ( Northbridge) 的 单元 是 用 于 编排 CPU 和 内 存 系统 包括 IO 控制 器 之 间 通 信 
的 集线器 Chub) 芯片 。 

© 类 似 地 ， 标 有 南 桥 (Southbridge) 的 单元 是 用 作 LO HARALD. EMA HT 
的 标准 IO 总 线 相 连接 ， 包 括 PCI 和 USB， 它 对 设备 进行 仲裁 ， 包括 总 线 、 通 过 北桥 
的 直接 访问 需求 和 通过 CPU HET AN POTS. ERAT 10.5 节 中 关于 VO 处 理 需 讨论 


的 许多 功能 。 

© PCI Express 是 另 一 个 支持 设备 所 需 的 高 传输 率 和 啊 应 时 间 的 总 线 标准 ， 例 如 高 分 辨 率 
的 图 形 显 示 。 

e LPC 代表 低 引 脚 数 (Low Pin Count), LPC 总 线 是 男 一 个 低 带 宽 设备 (如 键盘 和 鼠标 ) 
与 CPU 连接 的 标准 。 

。 标 有 高 级 VO 的 单元 是 负责 一 些 慢 速 设备 IO 控制 器 的 芯片 ， 慢 速 设 备 包 括 键盘 、 鼠 标 
和 打印 机 。 


正如 我 们 所 讨论 的 ， 计 算 机 系统 中 的 硬件 是 非常 令 人 着 迷 的 。 虽 然 我 们 在 本 节 将 PC 作为 
具体 的 例子 ,但 在 图 10-25 中 单元 的 功能 适用 于 任何 计算 机 系统 。 曾 经 有 一 段 时 间 根 据 机 硕 
的 种 类 不 同 ， 从 像 IBM PC 这 样 的 个 人 计算 机 到 像 Cray-1 这 样 的 向 量 超级 计算 机 ， 计 算 机 系 
统 内 部 构造 有 非常 大 的 不 同 。 随 着 单 芯片 微 处 理 器 技术 的 进步 ， 如 我 们 在 第 $ 章 中 所 讨论 的 ， 
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以 及 根据 摩尔 定律 所 能 达到 的 集成 密度 ( 见 第 3 章 )， 在 用 于 构成 计算 机 系统 的 构件 上 有 了 葵 
识 ， 范 围 从 PC 到 台式 机 ， 到 服务 器 ， 到 超级 计算 机 。 


小 结 


在 本 章 中 ， 我 们 讨论 了 如 下 主题; 

1 ) 处 理 器 和 IO 设备 之 间 的 通信 机 制 ， 包 括 程控 IO 和 DMA. 

2 ) 设备 控制 器 和 设备 驱动 。 

3) 现代 计算 机 系统 中 的 常规 总 线 ， 特 别 是 IO 总 线 。 

4 ) 磁盘 存储 器 和 磁盘 调度 算法 。 

在 下 一 章 我 们 将 学 习 文 件 系统 ， 文 件 系统 是 构建 在 所 有 稳定 性 存储 上 ， 特 别 是 硬盘 上 的 
软件 子 系统 。 


练习 题 


1. 试 将 程控 IO 与 直接 内 存 访 问 (DMA) 进行 比较 。 
2. 假设 磁盘 驱动 器 有 如 下 参数 : 
。 表面 的 数目 =200 
。 每 个 表面 的 磁道 数目 =100 
。 每 个 磁道 的 悄 区 数目 =50 
。 每 个 肩 区 的 字 节 数目 =256 
e EX =2400 RPM 
磁盘 的 总 容量 是 多 少 ? 
平均 旋转 延迟 是 多 少 ? 
磁盘 有 20 个 表面 ( 即 10 个 双 面 盘 片 )。 每 个 表面 有 1000 个 磁道 。 每 个 磁道 有 128 PK. EP 
有 64 字 节 。 磁盘 分 配 策 略为 每 个 文件 分 配 连续 多 个 柱 面 。 
每 个 柱 面 有 多 少 字 节 ? 
如 果 需 要 加 载 SMB 的 文件 ， 那 么 需要 多 少 个 柱 面 ? 
需要 给 这 个 SMB 文件 分 配 多 大 的 空间 ? 
4. 磁盘 有 如 下 参数 : 
。 做 盘 容 量 310MB 
© PEK): 4096 FT 
。 局 区 大 小 : 6477 
程序 员 有 96 个 对 象 ， 每 个 对 象 的 大 小 为 50 字 节 。 如 果 决 定 将 每 个 对 象 保存 为 单独 的 文件 ， 
际 写 入 磁盘 的 总 字 节 数 是 多 少 ? 
5. 描述 DMA 数据 传输 中 操作 序列 的 细节 信息 。 
6. 在 磁盘 驱动 器 能 够 读数 据 前 ， 需 要 做 哪些 机 械 操作 ? 
7. 
8. 
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磁盘 驱动 器 有 3 个 双 面 的 盘 片 。 驱 动 器 有 300 个 柱 面 。 每 个 表面 有 多 少 个 磁道 ? 
假设 磁盘 驱动 器 有 如 下 的 参数 : 

。 每 个 扇 区 512 字 节 

。 每 个 表面 30 个 磁道 

° 2 FAR 

2 区 位 记录 : 
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。 有 3 个 区 
区 3 (最 外 侧 )，12 个 磁道 ， 每 个 磁道 200 个 扇 区 
区 2 : 12 个 磁道 ， 每 个 磁道 150 TAK 
区 1 :6 个 磁道 ， 每 个 磁道 50 + a XK 
按照 上 述 区 位 记录 方法 ， 驱 动 器 的 总 容量 是 多 少 ? 
. 假设 磁盘 驱动 右 有 如 下 的 参数 : 
。 每 个 扇 区 256 个 字 节 
。 每 个 磁道 200 个 扇 区 
。 每 个 表面 1000 个 磁道 
27th 
。 旋转 速度 是 7500 RPM 
。 普通 记录 方式 
磁盘 的 传输 率 是 多 少 ? 
10. 假设 磁盘 驱动 咒 有 如 下 参数 : 
。 ENX 256 字 节 
。 每 个 磁道 100 个 扇 区 
。 每 个 表面 1000 个 磁道 
e 个 一片 
。 平 均 寻 道 时 间 是 gms 
。 旋 转速 度 为 15 000 RPM 
。 普通 记 录 方 式 
a. 从 同一 个 磁道 读 取 10 个 连续 的 扇 区 需要 多 长 时 间 ? 
b. 随机 读 取 10 个 而 区 需要 多 长 时 间 ? 
11. 磁盘 调度 算法 的 目标 是 什么 ? 
12. 用 遍历 的 磁道 数 作为 度量 时 间 的 标准 ， 查 看 表 10-3 中 总 结 的 不 同性 能 指标 ， 比 较 对 于 例 10-4 中 的 请 
求 模 式 ， 所 有 磁盘 调度 算法 的 性 能 表现 。 467 
13. 假设 磁盘 的 细节 信息 与 例 10-4 一 样 。 请 求 队列 不 是 保持 不 变 而 是 随 着 新 请 求 添 加 到 队列 中 会 发 生变 
化 。 在 任何 时 间 ， 算 法 都 根据 当前 的 请 求 来 决定 处 理 哪 一 个 请 求 。 考 虑 下 面 的 请 求 序 列 : 
。 初始 时 (在 时 间 0 )， 队 列 包 含 柱 面 99,3,25 的 请 求 。 
。 在 根据 算法 决定 接 下 来 处 理 哪 个 请 求 时 ， 新 的 请 求 加 入 了 队列 : 46。 
。 下 一 个 决策 点 ， 新 的 请 求 加 入 了 队列 : 75。 
。 下 一 个 决策 点 ， 新 的 请 求 加 入 了 队列 : 55。 
。 下 一 个 决策 点 ， 新 的 请 求 加 入 了 队列 : 85. 
。 下 一 个 决策 点 ， 新 的 请 求 加 入 了 队列 : 73。 
。 下 一 个 决策 点 ， 新 的 请 求 加 入 了 队列 : 50。 
假设 磁头 在 时 间 0 正在 处 理 磁道 55 的 请 求 。 
a. 给 出 FCFS、SSTF、SCAN、C-SCAN、LOOK 和 C-LOOK 的 调度 。 
b. 对 于 每 个 前 面 的 请 求 ， 计 算 响 应 时 间 (以 磁头 遍历 的 单元 数 为 度量 标准 )。 
c. 每 种 算法 的 平均 响应 时 间 和 吞吐 量 是 多 少 ? 


参考 文献 注释 和 扩展 阅读 
为 了 获取 最 先进 存储 技术 的 信息 ， 最 好 访问 那些 技术 上 领先 公司 的 网 页 。IBM、MAXTOR 和 
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Seagate 都 是 技术 先进 的 磁盘 生产 商 。 像 Samsung 和 Intel 在 基于 闪存 技术 的 SSD 市 场 上 都 处 于 领先 
地 位 ， 通 过 它们 的 网 页 可 以 获得 最 先进 的 SSD 存储 技术 的 信息 。 为 了 更 好 地 了 解 磁盘 缓存 设计 的 考 
虑 因素 ， 我 们 推荐 读者 阅读 Alan Jay Smith[Smith, 1985] 开创 性 的 论文 。 有 些 书 在 不 同 程度 上 介绍 
T VO 的 不 同方 面 。Hennessy and Patterson[Hennessy, 2006] 在 存储 系统 设计 方面 提出 了 先进 的 议题 。 
Tanenbaum[Tanenbaum, 2007] 从 在 操作 系统 中 管理 它们 ( 即 对 其 编写 程序 ) 的 角度 表述 了 UO。Bryant 
and O’Hallaron[Bryant, 2003] 从 用 户 级 编程 的 角度 表述 了 I/O, Silberschatz et al.[Silberchatz, 2008] 对 
大 容量 存储 设备 的 结构 (包括 磁盘 调度 算法 ) 进行 了 很 好 的 总 结 ， 包 括 操作 系统 中 管理 IO 设备 的 软件 
设计 方案 。 
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文件 系统 





在 本 章 ， 我 们 将 讨论 与 大 容量 存储 系统 有 关 的 一 些 话题 。 特 别 地 ， 我 们 将 讨论 在 设计 文 
件 系统 时 的 一 些 可 行 的 选择 ， 以 及 文件 系统 在 磁盘 (或 者 用 个 人 计算 机 领域 的 流行 说 法 ， 硬 
盘 ) 上 的 实现 。 要 认识 到 ， 文 件 系统 在 本 书 “阐述 整个 计算 机 系统 ”的 目标 中 所 扮演 的 重要 
角色 。 为 了 深刻 了 解 计算 机 系统 所 能 展现 出 的 能 力 ， 必 须 掌握 在 计算 机 内 部 信息 是 如 何 存储 
和 操作 的 。 因 此 ， 深 入 地 讲解 文件 系统 是 如 何 工作 的 对 于 滴 述 计算 机 系统 非常 重要 。 

我 们 都 已 经 对 现实 生活 中 存放 了 大 量 纸 质 材料 于 其 中 的 文件 柜 和 文件 夹 非常 熟悉 了 。 文 
件 夹 上 的 标签 可 以 用 来 确定 里 面 存放 的 
内 容 ， 从 而 方便 我 们 日 后 检索 。 通 常 ， 
我 们 可 能 会 在 文件 柜 里 放 一 个 目录 文件 
夹 用 于 说 明 所 有 文件 在 柜子 中 的 组 织 形 
式 ， 如 图 11-1 所 示 。 

文件 系统 与 我 们 现实 生活 中 的 文件 
柜 很 相似 。 每 个 文件 (类 似 于 一 个 纸 质 的 
文件 夹 ) 里 有 一 些 信息 ， 并 包含 了 一 些 与 
这 些 信息 相关 联 的 属性 。 进 程 是 对 处 理 
器 的 一 种 软件 抽象 ; 数据 结构 则 可 看 作 
内 存 的 软件 抽象 。 类 似 地 ， 文 件 可 以 是 
输入 /输出 设备 的 软件 抽象 ， 因 为 设备 ME PEPEES 
可 以 作为 信 源 或 信 宿 进行 服务 。 这 种 抽象 使 得 用 户 的 程序 可 以 用 一 种 与 设备 无 关 的 方式 与 
输入 /输出 进行 交互 。 

首先 ， 我 们 将 讨论 与 文件 相关 联 的 属性 ， 以 及 其 中 所 蕴含 的 一 些 设计 选项 。 然 后 我 们 将 
探讨 在 大 容量 存储 设备 上 实现 文件 系统 时 的 一 些 设计 选择 。 


11.1 属性 


与 文件 相关 联 的 属性 称 作 元 数据 。 元 数据 代表 空间 开销 ， 因 此 为 了 实用 性 考虑 ， 我 们 需 
要 对 此 进行 细致 的 分 析 。 

让 我 们 先 简单 地 了 解 一 些 可 能 要 与 文件 相关 的 属性 。 

。 文 件 名 : 该 属性 给 文件 内 容 一 个 逻辑 标识 。 例 如 ， 如 果 存 储 音 乐 文件 ， 我 们 可 能 希望 
给 每 张 唱片 一 个 唯一 的 名 称 。 为 了 能 够 方便 地 查找 ,我 们 可 能 会 保留 一 个 单独 的 目录 
文件 ， 里面 包含 了 所 有 音乐 唱片 的 名 称 。 很 容易 看 出 这 种 用 于 早期 的 存储 系统 (例如 ， 
Univac Exec 8 计算 机 (20 世纪 70 年代)) 的 单 层 命名 方案 太 过 局 限 。 之 后 的 一 些 系统 
(例如 ，DEC TOPS-10 ( 20 世纪 80 年 代 初 期 ) ) 使 用 两 层 命 名 方案 : 顶层 目录 可 以 访问 
一 个 单独 的 用 户 或 工程 (例如 ，Billy Joel 的 唱片 ); 第 二 层 则 指定 了 该 用 户 或 工程 下 的 
一 个 特定 文件 (例如 ， 某 一 首 特定 的 歌曲 )。 
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然而 ， 随 着 系统 变 大 ， 很 明显 需要 一 种 更 具有 层次 的 结构 来 对 文件 进行 命名 (比如 ， & 
个 用 户 可 能 希望 有 他 目 己 的 音乐 收藏 集 ， 其 中 包含 不 同 艺 术 家 的 作品 )。 换 句 话 说， 我 们 可 能 
需要 一 个 如 图 11-2 所 示 的 多 层 目录 。 


目录 目录 目录 音乐 文件 


用 户 
Eche 的 音乐 
Secret garden 
Bruce Springsteen Born to run 


I'm on fire 


We didn't start the fire 


: Piano man 
Billy Joel Uptown giri 
Changes 
Tupac Shakur California love 


图 11-2 多 层 目 录 。 分 层 结构 是 组 织 信息 的 自然 方法 


大 多 数 现 代 操 作 系统 ， 例 如 Windows XP, UNIX 以 及 MacOS， 都 实现 了 多 层次 的 命名 方 
案 。 文 件 名 的 每 个 部 分 仅 对 于 其 之 前 部 分 的 名 称 是 唯一 的 。 这 就 提供 了 一 种 树 形 结构 来 组 织 
文件 系统 中 的 文件 (如 图 11-3 所 示 )。 树 中 的 每 个 节点 是 一 个 对 其 父 节 点 而 言 唯一 的 名 字 。 目 
录 也 是 文件 。 在 图 11-3 中 的 树 结构 中 ， 中 间 节 点 就 是 目录 文件 ， 而 叶子 节点 就 是 数据 文件 。 
目录 文件 的 内 容 ， 就 是 以 该 目录 文件 为 根 的 下 一 层 子 树 中 的 文件 信息 (例如 ，users 目录 的 内 
容 是 {students, staff, faculty} ; 目录 faculty 的 内 容 则 是 教 


师 成 员 rama 等 )。 | 
有 些 操 作 系 统 在 文件 名 后 会 强制 性 加 入 扩展 名 (以 users 
后 级 的 形式 )。 例 如， 在 DEC TOPS-10 操作 系统 中 ， 文 AIN 


本 文件 会 自动 得 到 .TXT 的 后 组 并 附 在 用 户 给 出 的 名 称 后 students staff fatacltyy 
面 。 在 UNIX 和 Windows 操作 系统 中 ， 这 样 的 文件 扩展 


名 是 可 选 的 。 系 统 通过 后 组 来 猜测 文件 的 内 容 并 局 动 合 | TEN, 

适 的 应 用 程序 来 处 理 这 个 文件 (例如 ，C 编译 器 、 文 档 编 fdoo 

辑 器 、 相 片 编辑 软件 等 )。 图 11-3 文件 名 /users/faculty/rama/ 
有 些 操作 系统 允许 给 文件 一 个 别名 。 别 名 可 能 在 文 foo 的 树 形 结构 


件 实际 内 容 所 处 的 层 。 或 者 ， 别 名 也 可 能 只 是 简单 在 名 称 的 层 而 不 包括 其 实际 内 容 。 例 如 ， 
UNIX 中 的 jn 命令 (表示 链接 ) 就 可 以 给 一 个 已 存在 的 文件 创建 一 个 别名 。 命 令 


ln foo bar 


a 的 执行 结果 就 是 给 一 个 已 存在 的 名 为 foo 的 文件 创建 一 个 别名 bar。 这 样 的 别名 ， 也 称 作 硬 链 
,| 接 ， 给 予 新 名 称 bar 与 其 原始 名 称 foo 同等 的 状态 。 即 使 我 们 删除 了 文件 foo， 文 件 的 内 容 依 
471| 然 可 以 通过 名 称 bar 访问 到 。 


3193357 -rw------- 2 rama 80 Jan 23 18:30 bar 
3193357 -rw------- 2 rama 80 Jan 23 18:30 foo 
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我 们 将 在 11.3.1 节 中 解释 索引 节点 〈i-node) 是 什么 。 现 在 ， 我 们 只 需 了 解 它 是 表示 文件 
的 一 个 数据 结构 就 足够 了 。 注 意 ，foo 和 bar 的 内 部 表示 完全 一 样 ， 这 是 因为 它们 具有 相同 的 
索引 节点 。 它 们 两 者 拥有 相同 的 状态 ， 无 论 它们 之 间 的 创建 顺序 是 怎样 的 。 这 也 是 两 者 有 相 
同 大 小 、 相 同时 间 惟 的 原因 ， 尽 管 bar 比 foo 晚 创建 。 

将 前 面 的 情形 与 接 下 来 的 UNIX 命令 相 比较 : 

ln —s foo bar 


这 个 命令 同样 会 为 foo 创建 一 个 别名 bar. 


索引 节点 访问 权限 MRE 大 小 创建 时 间 名 称 
3193495 lrwxrwxrwx 1 rama 3 Jan 23 18:52 bar— foo 
3193357 -rw------- 1 rama 80 Jan 23 18:30 foo 


然而 ， 这 里 的 区 别 是 : bar 与 foo 在 名 称 上 是 等 价 的 ， 但 是 却 并 不 直接 指向 文件 内 容 。 注 
意 两 个 名 称 的 索引 节点 是 不 同 的 。 因 此 ，bar 的 创建 时 间 就 是 当 ln 命令 被 执行 从 而 创建 别名 
的 时 间 。 同 样 ， 它 们 的 文件 大 小 也 不 一 样 。foo 的 大 小 是 文件 真实 内 容 的 大 小 ， 而 bar 只 是 
foo 这 个 字符 串 的 大 小 (3 字 节 )。 这 样 的 别名 也 称 作 软 链接 。 用 这 两 个 文件 名 都 能 够 以 相同 
的 权限 来 操作 文件 内 容 。 然 而 ， 在 删除 文件 时 就 有 区 别 了 : 删除 foo 会 导致 文件 内 容 被 移 除 。 
名 称 bar 依然 存在 ， 但 是 其 别名 foo 和 里 面 的 内 容 已 经 不 存在 了 。 如 果 这 时 试图 访问 bar 的 内 
容 就 会 导致 错误 。 

你 可 能 想 知道 为 什么 操作 系统 硕 望 支持 两 种 不 同 的 别名 机 制 ， 即 硬 链 接 和 软 链接 。 这 是 
为 了 权衡 两 者 的 效率 和 可 用 性 。 软 链接 可 以 直接 告诉 你 原始 文件 名 ， 而 硬 链接 则 隐藏 了 这 个 
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所 以 ， 软 链接 增加 了 可 用 性 。 男 一 方面 ， 文 件 系 统 每 次 过 到 一 个 软 链接 ， 它 都 不 得 不 通 
过 遍历 其 内 部 数据 结构 (EI UNIX 中 的 索引 节点 ) 来 获得 其 别名 。 稍 后 我 们 将 看 到 在 UNIX X 
件 系 统 中 这 是 如 何 完成 的 。 硬 链接 直接 指向 原始 文件 名 称 的 内 部 表示 ， 因 此 就 无 需 额外 的 时 
间 开 销 来 获得 其 别名 ， 这 样 就 可 以 提升 文件 系统 的 性 能 。 

然而 ， 一 个 目录 的 硬 链接 会 导致 循环 链表 ， 使 得 删除 操作 变 得 困难 。 基 于 这 种 原因 ， 操 
作 系 统 (如 UNIX) 不 允许 对 目录 创建 硬 链接 。 

在 大 多 数 操作 系统 (UNIX, Windows) 中 ， 问 一 个 已 存在 的 文件 写 和 内容 会 导致 内 容 的 覆 
盖 。 然 而 ， 在 一 个 支持 版 本 控制 的 文件 系统 中 ， 这 种 写 人 可 能 会 创建 这 个 文件 的 另 一 个 版 本 。 

。 访 问 权 限 : 这 个 属性 指定 了 谁 可 以 访问 某 个 特定 文件 以 及 每 个 被 允许 用 户 拥 有 什么 权 

限 。 一 个 文件 的 权限 通常 包含 读 、 写 、 执 行 、 更 改 拥有 者 、 改 变 权 限 。 有 些 权限 存在 
于 个 人 用 户 级 别 〈 例 如 ,文件 的 创建 者 或 用 户 )， 另 一 些 权 限 只 对 系统 管理 员 (UNIX 中 
的 root 以 及 Windows 中 的 administrator) 开放 。 例 如 ，UNIX 中 一 个 文件 的 拥有 者 可 能 
会 执行 “更 改 文件 的 允许 模式 ”命令 : 


chmod u+w foo /* u stands for user; 
* w stands for write; 
* essentially this command 
* says add write access 
* to the user; 
* / 


该 命令 会 给 文件 拥有 者 写 foo 文件 的 权限 。 另 一 方面 ， 只 有 系统 管理 可 以 执行 “改变 拥 
有 者 ”命令 
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chown rama foo 
它 把 文件 foo 的 拥有 者 变 为 用 户 rama. 

一 个 对 于 文件 系统 设计 者 而 言 颇 有 意思 的 问题 就 是 应 该 如 何 控制 访问 权限 的 粒度 。 理 想 
情况 下 ,我 们 可 能 希望 给 系统 中 的 每 个 用 户 提 供 对 每 个 文件 独立 的 访问 权限 。 这 样 会 给 每 个 
文件 增加 O(n) 元 数据 空间 开销 ， 其 中 是 系统 的 用 户 数 。 操 作 系 统 试图 通过 各 种 设计 方案 限 
制 这 种 空间 开销 。 例 如 ，UNIX 将 用 户 分 成 3 种 : AP (user)、 组 (group) 和 所 有 的 (all). 
用 户 是 系统 的 一 个 授权 用 户 ; 组 是 系统 的 一 组 授权 用 户 ; 所 有 的 表示 系统 中 的 所 有 授权 用 户 。 
系统 管理 员 维 护 不 同 组 的 名 字 及 其 成 员 。 例 如 ，CS2200 课程 中 的 学 生 可 能 都 属于 一 个 名 为 
cs2200 的 组 。UNIX 文 持 对 任意 文件 设 定 个 人 用 户 的 所 有 权 以 及 组 的 所 有 权 。 文 件 的 所 有 者 
可 以 通过 下 列 命令 来 改变 组 的 所 有 权 ， 

chgrp cs2200 foo 
把 文件 foo 的 组 所 有 者 改 为 cs2200。 

UNIX 对 上 述 3 种 权限 的 每 一 个 都 提供 了 读 、 写 、 执 行 权限 。 因 此 ， 用 3 位 即 可 表示 对 
每 一 种 的 访问 权限 (对 读 、 写 、 执 行 分 别 用 1 位 表示 )。 执 行 权限 允许 将 文件 当 作 可 执行 程序 
来 运行 。 例 如 ， 编 译 顺 编译 并 链接 后 的 输出 就 是 一 个 二 进 制 可 执行 文件 。 下 面 的 例子 表示 一 
个 UNIX 文件 所 有 可 见 的 元 数据 : 

rwxrw-r-- 1 rama fac 2364 Apr 18 19:13 foo 

文件 foo 被 用 户 rama 和 组 fac 拥 所 有 。 第 一 个 字段 提供 了 3 种 用 户 访问 权限 。 前 3 位 
(rwx) 表示 给 用 户 (rama) 提供 了 读 、 写 、 执 行 权 限 ; 接 下 来 的 3 位 (rw-) 表示 给 组 (fac) 提 
ETR, SAR (没有 执行 权限 ); 最 后 的 3 位 (r--) 表示 所 有 用 户 都 有 读 权限 (没有 写 和 执 
行 的 权限 )。 在 访问 权限 之 后 的 数字 “1” 表 明 指 向 该 文件 的 硬 链接 个 数 。 文 件 的 大 小 是 2 364 
字 节 ， 而 文件 内 容 的 修改 时 间 是 4 月 18 日 19 点 13 分。 

Windows 操作 系统 以 及 某 些 UNIX 操作 系统 通过 访问 控制 列表 ACL) 来 对 每 个 文件 实 
现 更 细 粒 度 的 权限 控制 。 这 种 灵活 性 会 带 来 每 个 文件 元 数据 大 小 增加 的 代价 。 

表 11-1 总 结 了 常用 的 文件 系统 属性 以 及 它们 的 含义 。 表 11-2 列举 了 大 多 数 UNIX 文件 系 
统 文 持 的 一 些 和 常用 命令 。 所 有 命令 都 是 对 于 当前 工作 目录 而 言 的 (一 个 例外 是 ， 当 命令 指定 
了 UNIX 绝对 路 径 时 ， 例 如 /users/rrama ) 。 


表 11-1 文件 系统 属性 


属性 详细 描述 
名 称 文件 名 在 文件 创建 / 重 命名 时 设 定 的 属性 


别名 同一 个 物理 文件 的 其 他 名 称 当 创建 别名 时 设置 的 属性 ; 像 UNIX 这 样 的 系统 提供 了 显 式 
链接 、 符 号 的 / 软 链接 ) 
所 有 者 通常 是 文件 的 创建 者 在 文件 创建 时 设置 的 属性 ; 像 UNIX 这 样 的 系统 提供 了 可 以 


| 
创建 时 间 文件 第 一 次 创建 的 时 间 文件 被 创建 或 从 茶 个 其 他 地 方 复制 过 来 的 时 间 


上 次 写 时 间 | ”最近 一 次 文件 写 和 人 的 时 间 文件 写 人 /复制 时 设置 的 属性 ; 在 大 多 数 文件 系统 中 该 属性 


与 创建 时 间 属 性 一 致 。 注 意 把 一 个 文件 移 到 另 一 个 位 置 会 保留 
文件 的 创建 时 间 
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权限 对 文件 的 访问 权限 ， 指 定 了 哪个 用 | ”文件 创建 时 会 将 其 设置 成 默认 值 ; 通常 ， 文 件 系统 提供 了 可 
。 读 户 可 以 对 其 进行 什么 样 的 操作 让 所 有 者 修改 权限 的 命令 ; 现代 的 文件 系统 (A NTFS) 提供 了 
。 写 访问 控制 列表 (ACL )， 对 不 同 用 户 提供 不 同 级 别 的 访问 权限 
* 执行 | 
大 小 文件 系统 上 占据 的 所 有 空间 每 次 文件 修改 后 会 进行 更 新 的 属性 
表 11-2 常见 的 UNIX 文件 系统 命令 
TEE E 
touch <name> 创建 一 个 0 字 节 的 文件 <name>， 创 建 时 间 为 当前 
时 间 
mkdir <sub-dir> 创建 一 个 子 目 录 <sub-dir> 用 户 必 须 拥 有 当前 工作 目录 的 写 权 限 (如 果 <sub- 
dir> 是 相对 路 径 名 ) 以 便 能 够 成 功 执行 该 命令 
rm <name> 移 除 (或 删除 ) 名 为 <name>| 只 有 文件 的 所 有 者 (或 超级 用 户 ) 可 以 删除 该 文件 
的 文件 
rmdir <sub-dir> 移 除 (或 删除 ) 名 为 <sub-dir>| RÆ <sub-dir> 的 所 有 者 (或 超级 用 户 ) 可 以 删除 该 
的 子 目录 目录 


创建 一 个 名 为 <new> 的 软 链接 | ”两 者 只 是 在 名 称 上 有 等 价 性 ; 因此 文件 <orig> 被 删 


In —s <orig> <new> 





并 指 癌 <orig> 除 ， 与 <orig> 相关 的 存储 空间 被 收回 ， 因 此 <new> 
将 指向 一 个 不 存在 的 文件 
In <orig> <new> 创建 一 个 名 为 <new> 的 硬 链 接 | 即使 文件 <orig> 被 删除 了 ， 依 然 可 以 通过 <new> 
并 指向 <orig> 访问 到 物理 文件 
chmod <rights> <name> | 将 文件 <name> 的 访问 权限 修 | 只 有 文件 的 所 有 者 (或 超级 用 户 ) 可 以 修改 访问 
改 为 <rights> 权限 


chown <user> <name> 将 文件 <name> 的 所 有 者 修改 | 只 有 超级 用 户 可 以 修改 文件 的 所 有 者 
为 <user> 

chgrp <group> <name> 将 文件 <name> 的 所 有 组 修改 | 只 有 文件 的 所 有 者 (或 超级 用 户 ) 可 以 修改 与 该 文 
为 <group> 件 相 关 的 组 


cp <orig> <new> 为 文件 <orig> 创建 一 份 名 为 | ME <new> 是 文件 名 ,那么 会 在 同一 个 目录 下 创 
<new> 的 拷贝 建 一 个 拷贝 ， 如 果 <new> 是 目录 名 ， 则 会 在 <new> 
目录 下 创建 一 个 与 <orig> 文件 名 相同 的 文件 


mv <orig> <new> 将 文件 <orig> 重 命 名 为 <new> | 4 <new> 是 文件 名 时 ， 则 为 重 命名 操作 ; 若 <new> 
是 目录 名 ， 则 将 文件 <orig> 移 到 <new> 目录 下 


cat/more/less <name> 查看 文件 内 容 







11.2 ”在 磁盘 子 系统 上 实现 文件 系统 的 设计 选择 


我 们 的 讨论 先 从 把 文件 系统 当成 输入 /输出 设备 的 一 种 软件 抽象 开始 。 在 程序 执行 的 生 
命 周 期 之 外 ， 对 文件 系统 同等 重要 的 是 保存 信息 。 文 件 可 以 作为 满足 这 种 需求 的 一 个 方便 的 
抽象 。 永久 性 读 / 写 存储 器 就 是 保存 这 类 信息 所 需要 的 正确 解决 方案 。 文 件 系统 是 操作 系统 
另 一 个 重要 的 软件 子 系统 。 通 过 使 用 磁盘 作为 永久 性 存储 器 ， 我 们 将 讨论 实现 文件 系统 时 的 
一 些 设计 选项 。 

就 像 我 们 在 第 10 章 中 看 到 的 ， 磁 盘 在 物理 上 由 盘 片 、 盘 道 以 及 扇 区 组 成 。 一 个 给 定 的 磁 
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盘 会 有 特定 的 固定 硬件 参数 。 逻 辑 上 ， 相 应 的 多 个 盘 片 组 成 了 一 个 柱 面 。 磁 盘 与 IO 之 间 的 
延迟 通常 由 4 部 分 组 成 : 

。 寻找 指定 柱 面 时 间 。 

。 将 磁盘 的 读 / 写 头 旋转 到 特定 扇 区 的 旋转 延迟 。 

。 倒 盘 控 制 器 缓冲 区 的 传输 时 间 。 

。 控 制品 绥 冲 区 与 系统 内 存 之 间 的 DMA 传输 。 

我 们 知道 一 个 文件 可 以 是 任意 大 小 的 ， 程 序 也 是 一 样 。 例 如 ， 包 含 了 一 些 简 单 ASCII x 
本 的 文件 可 能 只 有 几 KB 大 小 。 另 一 方面 ， 你 下 载 到 计算 机 上 的 一 部 电影 可 能 会 占据 几 百 MB 
空间 。 文 件 系统 需要 从 用 户 的 角度 将 文件 作为 存储 抽象 和 硬盘 的 物理 细节 之 间 的 桥梁 。 一 个 
文件 (取决 于 其 大 小 ) 可 能 占据 多 个 扇 区 ， 多 个 盘 道 ， 甚 至 多 个 磁道 。 

因此 ， 文 件 系统 中 的 一 个 基本 设计 问题 就 是 文件 在 磁盘 上 的 物理 表示 。 设 计 上 既 需 要 考 
虑 最 终 用 户 的 需求 ， 也 要 考虑 系统 的 性 能 。 我 们 来 看 一 看 这 些 问题 。 从 用 户 的 角度 ， 可 能 有 
两 个 需求 : 首先 ， 用 户 可 能 希望 按 顺 序 查看 文件 的 内 容 (pila, UNIX 中 的 more, less 和 cat 
命令 ); HK, 用户 可 能 希望 在 一 个 文件 中 搜索 特定 的 内 容 (例如 UNIX 的 tail 命令 )。 前 者 表 
明 物 理 表示 需 要 能 够 支持 有 效 的 线性 访问 ; 而 后 者 是 随机 访问 。 从 系统 性 能 的 角度 ,文件 系 
统 的 设计 应 当 能 够 支持 文件 的 按 需 扩展 ， 以 及 当 创 建新 文件 或 者 扩展 已 有 文件 时 在 磁盘 上 能 
够 进行 空间 的 有 效 分 配 。 

因此 文件 系统 设计 时 的 性 能 系数 9 是 : 

。 快速 的 顺序 访问 。 

。 快速 的 随机 访问 。 

。 扩展 文件 的 能 力 。 

。 人 简单 的 存储 分 配 。 

。 人 磁盘 上 的 空间 利用 率 。 

在 接 下 来 的 几 节 里 ， 我 们 将 比较 几 种 在 硬盘 上 的 文件 分 配方 案 。 对 每 种 方案 ,我 们 将 讨 
论文 件 系统 中 需要 的 数据 结构 ， 以 及 每 种 方案 在 性 能 系数 上 的 特点 。 对 于 余下 的 讨论 ， 我 们 
将 定义 一 些 常 用 术语 。 磁 盘 上 的 地 址 用 一 个 三 元 组 { 柱 面 #， 表 面 #， 遍 区 上 内 表示 。 文 件 系 
统 认为 磁盘 由 多 个 磁盘 块 (文件 系统 的 一 个 设计 参数 ) 构成 。 每 个 磁盘 块 是 磁盘 上 的 一 段 物理 
的 连续 区 域 (也 就 是 一 组 扁 区 、 盘 道 或 柱 面 ， 取 决 于 具体 的 分 配方 案 )， 是 文件 系统 管理 磁盘 
空间 时 的 最 小 单元 。 为 了 简化 讨论 ， 我 们 用 磁盘 块 地 址 作为 对 应 一 个 特定 磁盘 块 的 磁盘 地 址 
( 即 四 元 组 { Hm #, AHH, HBR #， 磁 盘 块 大 小 })， 并 用 整数 来 表示 。 


11.2.1 连续 分 配 


磁盘 分 配方 案 与 第 8 章 中 介绍 过 的 基于 固定 的 /可 变 大 小 的 内 存 分 配方 案 有 相似 之 处 。 
在 创建 文件 时 ， 文件 系 统 给 这 个 文件 预 分 配 固定 大 小 的 空间 。 分 配 的 空间 大 小 取决 于 文件 
的 类 型 (例如 ,文本 文件 /媒体 文件 )。 而 且 ， 分配 的 空间 大 小 是 文件 能 够 达到 的 最 大 大 小 。 
图 11-4 展示 了 这 种 方案 所 需 的 数据 结构 。 目 录 数 据 结构 中 的 每 项 包含 了 一 个 文件 名 到 磁盘 
块 地 址 的 映射 ， 以 及 分 配给 该 文件 的 磁盘 块 个 数 。 

文件 系统 需要 维护 一 个 包含 可 用 磁盘 块 的 空闲 链表 ( 见 图 11-5 )。 空 闲 链表 使 文件 系统 可 
以 记录 当前 还 未 分 配 的 磁盘 块 。 在 第 8 章 中 ， 我们 讨论 了 在 出 现 页 错时 内 存 管理 器 通过 物理 

”性 能 系数 是 指 用 于 评价 系统 性 能 的 标准 。 
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帧 的 空闲 链表 来 处 理 的 方法 。 类 似 地 ,文件 系统 在 需要 创建 新 文件 时 通过 磁盘 块 的 空闲 链表 
进行 磁盘 块 分 配 。 我 们 将 看 到 ， 空 闲 链表 的 细节 取决 于 文件 系统 所 使 用 的 具体 分 配 策略 。 





图 11-4 一 个 连续 分 配 的 例子 : 文件 名 到 磁盘 块 地 址 的 上 映射。 连续 分 配 的 大 小 与 文件 大 
小 相 匹 配 





图 11-5 用 于 连续 分 配 的 空闲 链表 ， 每 个 节点 包含 了 { 起 始 磁盘 块 地 址 指针 ， 块 数 } 的 信息 


为 了 进行 连续 分 配 ， 空 闲 链表 中 的 每 个 节点 包含 开始 磁盘 块 地 址 和 可 用 的 块 数 。 为 一 个 
新 文件 分 配 磁盘 块 时 可 以 采用 最 先 适 配 或 最 佳 适 配 策略 。 在 文件 删除 时 ， 释 放 的 磁盘 块 将 
回 到 空闲 链表 中 。 文 件 系统 将 相 邻 的 节点 进行 合并 形成 更 大 的 连续 磁盘 块 区 间 。 当 然 ， 考 虑 
到 其 中 的 开销 ， 文 件 系统 不 能 经 常 进行 这 种 压缩 操作 。 当 用 户 显 式 地 进行 请 求 时 文件 系统 才 
进行 这 样 的 操作 。 这 种 描述 与 第 8 章 中 可 变 大 小 的 内 存 划分 有 些 类 似 ， 且 这 种 磁盘 分 配 策略 
也 会 有 类 似 的 外 部 碎片 问题 。 而 且 ， 由 于 文件 系统 在 创建 文件 时 申请 的 是 固定 大 小 的 磁盘 块 
(为 了 满足 文件 最 大 的 大 小 )， 所 以 这 种 方案 也 会 有 内 部 碎片 (与 第 8 章 中 的 固定 大 小 的 内 存 划 
分 方案 类 似 ) 的 问题 。 

文件 系统 既 可 以 把 这 些 数据 结构 放 在 内 存 中 ， 也 可 以 放 在 硬盘 上 。 由 于 文件 是 永久 性 存 
储 ， 所 以 这 些 数据 结构 也 不 得 不 放 到 永久 性 存储 融 中 (也 就 是 说 ， 有 些 磁 盘 块 用 来 实现 这 些 
数据 结构 )。 因 此 ， 这 些 数据 结构 驻 留 在 磁盘 。 然 而 ， 为 了 进行 更 快 的 分 配 ， 以 及 加 速 文件 的 
访问 ， 文 件 系统 需要 把 这 些 数据 结构 缓存 到 内 存 中 。 

我 们 需要 对 这 种 方案 的 性 能 参数 进行 定量 分 析 。 分 配 的 代价 可 能 会 很 高 ， 这 取决 于 具体 
使 用 的 算法 (最 先 适 配 或 最 佳 适 配 )。 由 于 文件 占据 了 一 块 固定 的 区 间 (磁盘 上 的 一 段 连续 区 
域 )， 所 以 文件 的 线性 访问 和 随机 访问 都 非常 迅速 。 当 磁盘 头 位 于 特定 文件 的 起 始 磁盘 块 地 
址 ， 这 种 方案 的 特点 使 得 我 们 只 需要 很 少 的 一 点 额外 时 间 就 可 以 跳 转 到 文件 的 不 同 部 分 。 这 
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种 分 配方 案 有 两 个 缺点 : 

1 ) 当 文 件 增长 到 创建 时 分 配 的 大 小 以 上 后 就 无 法 进行 扩展 了 。 一 种 可 能 的 解决 方法 是 在 
空闲 链表 中 寻找 一 个 更 大 的 区 间 ， 然 后 将 文件 复制 到 这 个 新 分 配 的 区 间 里 。 这 样 做 的 代价 非 
fi ea 5 而 且 需 要 存在 一 个 可 用 的 更 大 区 间 才 可 以 。 

2) 如 我 们 之 前 所 说 ， 这 种 方案 会 因为 内 部 碎片 和 外 部 碎片 造成 潜在 的 空间 浪费 。 

例 11-1 


设 
磁盘 上 的 柱 面 数 ”=10000 
Ht Hr & =i 


EN GHAR =2 
每 个 磁道 的 局 区 数 = 128 
gS Fy KY HK =256 
磁盘 分 配 策略 = 连续 的 柱 面 
a. 一 个 3MB 的 文件 需要 分 配 多 少 个 柱 面 ? 
b. 这 种 分 配方 式 会 产生 多 少 内 部 碎片 ? 
答 : 
a. 一 个 柱 面 上 的 磁盘 道 数 = 盘 片 数 Xx 每 个 盘 片 的 面 数 =10X2=20。 
磁道 的 大 小 = 磁道 的 遍 区 数 Xx 扁 区 大 小 =128Xx256 =2” 字 节 。 
一 个 柱 面 的 容量 = 柱 面 的 磁道 数 X 磁道 大 小 =20X2” = 10X2" 字 节 。 
3MB 文件 的 柱 面 数 =CEIL((3X2”)/(10Xx2'))=5 
b. 内 部 碎片 大 小 =5 个 柱 面 的 容量 -3MB = 3 276 800 一 3 145 728 = 131 072 F 


11.2.2 ”和 带 有 洲 出 区 域 的 连续 分 配 


这 种 策略 与 前 一 种 几乎 一 样 ， 不 同 之 处 是 文件 系统 设置 了 一 个 溢出 区 域 供 无 法 放 入 初始 
分 配 的 固定 区 间 的 大 文件 使 用 。 溢 出 区 域 同 样 也 是 由 物理 上 连续 的 区 域 组 成 ， 用 以 容纳 大 文 
件 溢出 的 部 分 。 因 此 文件 系统 需要 一 个 额外 的 数据 结构 来 管理 溢出 区 域 。 这 种 方案 与 前 一 种 
几乎 一 样 ， 除 了 性 能 参数 上 有 一 些 不 同 处 。 这 种 方案 的 好 处 是 ,文件 可 以 增长 到 溢出 区 域 所 
允许 的 大 小 ， 却 无 需 任何 其 他 的 高 代价 操作 。 其 不 利之 处 是 ， 对 于 大 文件 的 随机 访问 可 能 会 
稍微 受到 一 些 影响 (需要 和 额外 的 寻 道 时间 )。 

尽管 有 一 些 限 制 , 但 连续 分 配 依然 由 于 其 文件 访问 时 间 上 的 显著 性 能 优势 ， 在 IBM VM/ 
CMS 等 系统 上 广泛 使 用 。 


11.2.3 ”链接 分 配 


在 这 种 方案 中 ， 文 件 系统 在 单个 磁盘 块 的 层面 上 处 理 分 配 。 文 件 系 统 需要 维护 一 个 包含 
所 有 可 用 磁盘 块 的 空闲 链表 。 一 个 文件 可 以 占据 任意 大 小 的 磁盘 块 来 存储 到 磁盘 上 。 当 文件 
大 小 增长 时 ， 文 件 系统 就 从 空闲 链表 分 配 新 的 磁盘 块 。 空 闲 链表 实际 上 是 一 个 磁盘 块 的 链表 ， 
每 一 块 都 指向 磁盘 的 下 一 个 空闲 块 。 文 件 系统 将 这 个 链表 的 头 指 针 缓 存 到 内 存 中 以 便 快 速 地 
分 配 磁 盘 块 来 满足 新 的 分 配 请 求 。 在 删除 文件 时 ， 文 件 系 统 将 磁盘 块 放 回 空闲 链表 。 通 第 ， 
通过 磁盘 块 来 维护 这 样 的 表 在 进行 遍历 时 非常 耗 时 。 男 一 种 方法 是 用 一 个 位 矢量 来 实现 这 个 
链表 ， 每 个 磁盘 块 1 位 。 如 果 对 应 的 位 是 0， 则 表明 该 块 处 于 空闲 状态 ; 为 1， 则 表示 处 于 愤 
碌 状态 。 
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注意 随 着 时 间 的 流逝 空闲 链表 也 会 产生 变化 ， 例 如 应 用 程序 产生 和 删除 文件 或 者 文件 增 
大 或 减 小 时 。 因 此 ， 无 法 保证 文件 会 占据 连续 的 磁盘 块 。 所 以 ， 如 图 11-6 所 示 ， 文 件 在 物理 
上 和 存储 于 一 个 磁盘 块 的 链表 中 。 与 前 面 的 分 配方 案 一 样 ， 一 部 分 磁盘 块 用 于 保存 文件 系统 的 
水 久 性 数据 结构 (空闲 链表 和 目录 )。 





图 11-6 链接 人 分配。 磁盘 块 构成 了 一 个 链表 的 数据 结构 


这 种 方案 的 好 处 是 分 配 速度 很 快 ， 因 为 每 次 只 分 配 一 个 磁盘 块 。 而 且 文 件 的 增长 也 变 得 
更 容易 。 由 于 这 种 按 需 分 配 的 特点 ， 所 以 不 会 存在 外 部 碎片 。 因 此 也 就 无 需 磁盘 压缩 。 从 不 
利之 处 看 ， 由 于 一 个 文件 的 磁盘 块 不 一 定 是 连续 的 ， 所 以 与 连续 分 配 相 比 文件 访问 的 性 能 可 
能 不 太 好 ， 尤 其 是 随机 访问 ， 还 需要 从 磁盘 块 上 获取 下 一 块 的 指针 。 即 使 是 顺序 访问 ， 也 会 
因为 从 链表 中 定位 到 不 同 磁盘 块 的 时 间 而 导致 效率 不 高 。 这 种 方案 的 易 出 错 性 也 是 男 一 个 劣 
势 : 在 链表 维护 时 产生 的 任何 程序 错误 都 会 导致 文件 系统 的 彻底 损坏 。 


11.2.4 ”文件 分 配 表 


这 是 链接 分 配 的 一 个 变种 。 在 磁盘 上 的 文件 分 配 表 (FAT) 包含 了 当前 保存 磁盘 中 文件 的 
链表 ( 见 图 11-7 )。 这 种 方案 从 逻辑 上 将 磁盘 分 成 多 个 区 。 每 个 区 有 一 个 FAT， 其 中 的 每 项 对 
应 一 个 特定 的 磁盘 块 ， 而 朵 / 忙 字 段 表 明 这 一 块 的 可 用 性 (0 表示 空闲 ; 1 表示 忙 ); 下 一 个 字 
段 给 出 了 表示 文件 的 链表 中 的 下 一 个 磁盘 块 。 特 异 值 (-1 ) 表明 这 一 项 是 该 文件 的 最 后 一 个 
磁盘 块 。 对 整个 区 ， 一 个 单独 的 目录 包含 了 文件 名 到 FAT 索引 的 映射 ， 如 图 11-7 所 示 。 与 链 
接 分 配 类 似 ， 文 件 系统 根据 需求 给 文件 分 配 磁盘 块 。 

比如 ，/foo 占据 了 两 个 磁盘 块 : 30 和 70。 项 30 的 下 一 个 字段 的 值 是 70， 即 下 一 个 磁盘 
块 的 地 址 。 项 70 的 下 一 个 字段 的 值 是 -1， 表 示 这 是 /foo 的 最 后 一 个 磁盘 块 。 类 似 地 ，/bar 4 
据 了 一 个 磁盘 块 (50 )。 如 果 /foo 和 /bar 变 大 ， 我 们 会 分 配 一 个 空闲 的 磁盘 块 并 相应 地 修改 
FAT。 

让 我 们 来 分 析 这 种 方案 的 优 劣 。 由 于 FAT 以 一 种 表格 数据 结构 的 方式 组 织 磁盘 的 链表 结 
构 ， 所 以 与 链接 分 配 相 比 它 发 生 错 误 的 概率 会 更 小 。 同 时 ， 通 过 将 FAT 缓存 在 内 存 中 ， 还 可 
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以 获得 更 快 的 分 配 速度 。 在 进行 顺序 文件 访问 时 FAT 与 链接 分 配方 法 相似 。 对 于 随机 访问 ， 
由 于 包含 了 文件 下 一 块 指针 所 以 它 可 以 获得 更 好 的 效率 。 





图 11-7 文件 分 配 表 (FAT)。 表 示 每 个 文件 的 链表 通过 数组 来 维护 


这 种 方案 的 一 个 最 大 劣势 是 磁盘 的 逻辑 分 区 。 这 是 一 种 对 最 终 用 户 而 言 不 太 友 好 的 磁盘 
空间 管理 方式 。 即 使 在 磁盘 上 有 足够 的 物理 空间 ， 它 还 是 会 在 磁盘 空间 的 特定 分 区 上 制造 一 
种 人 为 的 稀缺 性 。 然 而 ， 由 于 其 简便 性 (在 目录 中 的 集中 数据 结构 和 FAT)， 这 种 分 配方 案 在 
+ 早期 的 个 人 计算 机 操作 系统 (例如 ，MS-DOS 和 IBM OS/2 ) 中 非常 流行 。 


482 这 个 问题 主要 关注 FAT 的 磁盘 空间 分 配 策略 。 假 设 有 20 个 数据 块 ， 编 号 为 1 ~ 20。 
磁盘 上 有 3 个 文件 : 
foo 占据 磁盘 块 1、2 和 3。 
bar 占据 磁盘 块 10、13、15、17、18 和 19。 
gag 占据 磁盘 块 4、5、7 和 9。 
请 写 出 FAT 的 内 容 〈 用 本 节 中 使 用 的 表示 空闲 / 忙 的 方法 表示 )。 
答 : 





= 2 


11.2.5 ”索引 分 配 


这 种 方案 为 每 个 文件 分 配 一 个 索引 磁盘 块 。 文 件 的 索引 块 是 一 个 包含 了 文件 所 有 数据 块 
地 址 的 固定 大 小 的 数据 结构 。 这 种 方案 将 文件 的 数据 块 指针 聚集 到 一 起 放 到 一 个 文件 中 ， 如 
图 11-8 所 示 。 这 张 表 称 为 索引 节点 ( index-node，i-node)， 占 一 个 磁盘 块 。 目 录 (也 存储 在 磁 
RE) 包含 了 每 个 文件 的 文件 名 到 索引 节点 的 映射 。 与 链接 分 配 类 似 ， 这 种 方案 用 磁盘 块 的 
一 个 位 矢量 来 维护 空闲 链表 (0 表示 空闲 ，1 表示 忙 )。 


目 : 





图 11-8 索引 分 配 。 与 FAT 所 有 文件 用 一 个 表 来 表示 不 同 ， 索 引 分配 为 每 个 文件 分 配 了 
一 个 单独 的 表 (索引 块 ) 


与 FAT 相 比 ， 这 种 方案 对 于 随机 访问 表现 得 更 好 ， 因 为 索引 节点 把 所 有 磁盘 块 指针 聚集 
到 了 一 个 简洁 的 数据 结构 中 。 不 足 之 处 是 文件 的 最 大 大 小 有 限制 ， 因 为 每 个 文件 的 索引 市 点 
拥有 固定 的 数据 结构 ， 其 直接 指向 了 各 个 数据 块 。 索 引 节 点 中 数据 块 指针 的 个 数 决 定 了 文件 
可 能 的 最 大 大 小 。 

我 们 将 在 下 面 的 各 节 中 探索 其 他 能 够 消除 这 种 最 大 文件 限制 的 方案 。 


考虑 磁盘 上 的 索引 分 配方 案 : 
。 磁盘 有 1OR AH (每 个 盘 片 有 2 个 面 )。 
。 每 个 面 有 1000 个 磁道 。 
。 每 个 磁道 有 400 4} FE. 
。 每 个 高 区 有 512 $F. 
。 每 个 索引 节点 是 固定 大 小 的 数据 结构 ， 占据 一 个 局 区 。 
。 一 个 数据 块 ( 即 分 配 的 单位 ) 是 连续 的 2 个 柱 面 。 
。 指向 磁盘 数据 块 的 指针 用 一 个 8 字 节 的 数据 结构 表示 。 
问 : 
a. 文件 系统 创建 一 个 文件 最 小 需要 占用 多 少 空间 ? 
b. 根据 上 述 分 配方 案 ， 一 个 文件 最 大 可 以 达到 多 少 ? 
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一 个 磁道 的 大 小 = 每 个 磁道 的 遍 区 数 Xx BRA = 400x512 字 节 =200KB (K=1024 ) 

一 个 柱 面 的 磁道 数 = BHR X 每 个 盘 片 的 面 数 =10X2=20 

一 个 柱 面 的 大 小 = 柱 面 的 磁道 数 Xx 磁道 大 小 = 20 x200KB = 4000KB 

分 配 单元 (数据 块 )=2 个 柱 面 =2x4000KB = 8000KB 

索引 节点 的 大 小 = 遍 区 大 小 =5$12 字 节 

a. 一 个 文件 的 最 小 空间 = 索引 节点 大 小 十 数据 块 大 小 =512+(8000 x 1024)=8 192 512 字 节 
索引 节点 中 的 数据 块 指 针 个 数 = 索引 节点 大 小 / 数据 块 指针 大 小 =512/8=64 

b. 文件 的 最 大 大 小 = 索引 市 点 的 数据 块 指针 个 数 X 数据 块 大 小 =64 X 8000KB = 5 24 288 000 字 节 


11.2.6 ”多 级 索引 分 配 


这 种 方案 通过 把 文件 的 索引 节点 变 为 一 个 间接 表 来 修复 索引 分 配 中 的 限制 。 例 如 ， 通 过 
一 级 间接 索引 ， 每 个 索引 节点 项 指向 一 个 指向 数据 块 第 一 级 表 ， 如 图 11-9 所 示 。 在 图 中 ，foo 
的 索引 节点 包含 了 一 个 第 一 级 间接 索引 块 的 指针 。 第 一 级 间接 表 的 数目 与 等 于 索引 节点 保存 
的 指针 数 。 这 些 第 一 级 间接 表 存 储 了 指向 文件 数据 块 的 指针 。 





11-9 多 级 索引 分 配 (一 级 间接 索引 )。 与 单 级 的 索引 分 配 相 比 ， 这 种 方案 在 应 对 文件 增长 时 更 灵活 


这 种 方案 还 可 以 将 索引 节点 继续 扩展 成 二 级 (甚至 更 高 级 ) 的 间接 表 ， 这 取决 于 文件 系统 
需要 支持 的 文件 大 小 。 这 么 做 的 不 利之 处 是 ， 即 使 一 个 只 需 几 个 数据 块 的 小 文件 也 需要 额外 
级 的 间接 信息 。 


11.2.7 混合 索引 分 配 


这 种 方案 结合 了 前 两 种 的 特点 来 形成 一 种 新 的 混合 方案 。 如 图 11-10 所 示 ， 每 个 文件 有 
一 个 索引 节点 。 对 于 小 文件 ， 所 有 的 数据 块 用 直接 指针 存储 表示 。 如 果 文 件 大 小 超过 了 直接 
数据 块 能 表示 的 容量 ， 那 么 将 使 用 一 个 一 级 甚至 更 多 级 的 间接 索引 来 表示 其 他 的 数据 块 。 图 
11-10 中 的 /foo 使 用 了 直接 、 一 级 间接 和 二 级 间接 指针 。/foo 的 索引 节点 是 一 个 复杂 的 数据 续 


构 : 它 有 两 个 直接 数据 块 的 指针 (100 和 201); 一 个 一 级 间接 索引 块 的 指针 (40); 一 个 二 
间接 索引 块 的 指针 (45); 指向 一 级 间接 索引 块 的 指针 ( 60 和 70 ) 多 个 指针 ; 一 个 三 级 间接 
索引 块 的 指针 (当前 还 未 分 配 )。 这 种 方案 在 保留 了 前 面 两 种 方案 优点 的 同时 克服 了 两 者 的 缺 
点 。 当 创建 文件 时 ， 只 将 索引 节点 分 配给 它 ， 也 就 是 说 ， 初 始 时 其 一 级 、 二 级 、 三 级 间接 指 
针 都 是 空 的 。 如 果 文 件 还 没有 超过 直接 块 中 的 容量 大 小 ， 就 没 必 要 创建 额外 的 索引 块 。 然 而 ， 
当 文 件 逐 渐 增 长 并 超过 了 直接 数据 块 的 容量 时 ， 我 们 才 会 按 需 通过 一 级 /二 级 /三 级 索引 块 的 
方式 分 配 更 多 的 空间 。 





/foo 的 索引 节点 





图 11-10 ”混合 索引 分 配 。 这 是 一 种 单 级 与 多 级 索引 分 配 的 折 中 方案 ， 在 保证 快速 访问 小 
文件 的 同时 也 允许 文件 可 以 不 断 扩展 


例 11-4 
设 
© 索引 块 大 小 =512 $F 
© 数据 块 大 小 = 2048 $F 
。 指针 大 小 =8 字 节 (指向 索引 块 或 数据 块 ) 487 
索引 节点 的 组 成 为 : 
。2 个 直接 数据 块 指针 
。 1 个 一 级 间接 指针 
。 1 个 二 级 间接 指针 
一 个 索引 块 用 于 存储 一 个 索引 节点 ， 也 可 以 用 来 存储 指向 其 他 索引 块 或 数据 块 指针 的 索引 块 。 在 下 
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索引 
指向 数据 
HAJTS ET 






指向 包含 多 个 一 
级 间接 指针 的 索 
引 块 的 指针 


a. 在 这 个 文件 系统 中 ， 一 个 文件 的 最 大 大 小 可 以 是 多 少 ( 字 节 )? 
b. 一 个 266KB 的 文件 需要 多 少数 据 块 ? 


c. 一 个 266KB 的 文件 需要 多 少 索 引 块 ? 
A 


a. 一 级 间接 索引 或 二 级 间接 索引 指针 在 一 个 索引 块 中 的 个 数 =512 /8= 64。 

直接 数据 块 的 个 数 = 2。 

一 个 索引 节点 包含 了 1 个 指向 某 个 包含 了 多 个 指向 数据 块 指针 的 索引 块 (这 类 索引 块 也 称 一 级 间接 
索引 块 ) 的 一 级 间接 指针 。 

通过 一 级 间接 索引 的 数据 块 个 数 = 索引 块 中 的 数据 块 指针 个 数 = 64。 

一 个 索引 节点 包含 了 1 个 二 级 间接 指针 ， 其 指向 一 个 包含 了 64 个 一 级 间接 指针 的 索引 块 GRR 
引 块 也 称 二 级 间接 索引 块 )。 每 个 这 样 的 指针 都 指向 一 个 一 级 间接 索引 块 ， 其 中 的 每 个 又 指向 64 个 数据 
块 。 如 上 图 所 示 。 

因此 ， 通 过 二 级 间接 索引 的 数据 块 个 数 = 一 个 索引 块 中 的 一 级 间接 指针 个 数 X 索引 节点 包含 的 数 
据 块 指针 个 数 =64X64。 

块 中 的 最 大 文件 大 小 = 直接 数据 块 个 数 + 通过 一 级 间接 索引 的 数据 块 个 数 + 通过 二 级 间接 索引 的 
数据 块 个 数 =2+64+64Xx64=4162 数据 块 。 

最 大 文件 大 小 = 块 中 的 最 大 文件 大 小 xX 数据 块 大 小 =4162X2048 字 节 = 8 523776 字 节 。 

b. 需要 的 数据 块 个 数 = 文件 大 小 /数据 块 大 小 =226Xx2" /2048 = 133。 

c. 为 了 索引 133 个 数据 块 ， 我们 需要 : 

1 个 索引 节点 (包含 2 个 直接 数据 块 ) 

1 个 一 级 间接 索引 块 (索引 64 个 数据 块 ) 

1 个 二 级 间接 索引 块 

二 级 简介 索引 块 上 的 2 个 一 级 间接 索引 块 (从 而 获得 了 剩 下 的 64+3 个 数据 块 ) 

因此 ， 我 们 共 需 要 5 个 索引 块 。 
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11.2.8 不同 分 配 策略 的 比较 
K 11-3 总 结 了 多 种 分 配 策略 之 间 的 优 劣 。 
表 11-3 各 种 分 配 策略 比较 


53 空闲 链表 维护 文件 增长 空间 效率 


连续 续 块 复杂 非常 好 IE A OF 中 到 高 内 部 /外 
seal elt hed ll ll Baa ©- Ea 
7 Bs 


带 溢出 的 连续 |( 小 文件 ) 连续 块 
via | a i 
Hk 








FAT 非 连续 块 ll F， 但 
”| 


多 级 索引 非 连续 块 位 矢量 


f, 但 是 | oF, BE| & 小 优秀 
取决 于 寻 道 | 取决 于 寻 道 
th = 
混合 索引 非 连续 块 位 矢量 好 ， 但 和 好 秀 
时 间 | 


为 了 让 文件 系统 可 以 应 对 电力 故障 ， 文 件 系 统 的 永久 性 数据 结构 CGE, Sol TA. 8 
闲 链表 、 目 录 、FAT 等 ) 需要 驻 留 在 磁盘 上 。 保 存 这 些 数据 结构 所 需 的 磁盘 块 数量 代表 了 菏 
种 分 配 策 略 的 空间 开销 。 访 问 这 些 数 据 结构 还 有 时 间 开 销 ， 因 此 文件 系统 还 需要 将 这 些 关 键 
的 数据 结构 缓存 到 主 存 上 以 避免 时 间 代 价 。 


= 
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作为 一 个 具体 的 例子 ，UNIX 操作 系统 通过 层次 化 命名 实现 了 混合 分 配方 式 。 通 过 层次 化 
命名 ， 目 录 结 构 不 再 是 集中 的 。 每 个 索引 节点 表示 层次 名 称 中 多 个 部 分 中 的 一 部 分 。 除 了 村 
叶 节 点 上 的 数据 文件 外 ， 所 有 的 中 间 节 点 都 是 目录 节点 。 索 引 节点 中 的 类 型 字段 表明 该 他 点 
是 目录 还 是 数据 文件 。 索 引 节 点 的 数据 结构 包含 了 其 他 一 些 我 们 之 前 讨论 过 的 文件 属性 ， 例 
如 访问 权限 、 时 间 戳 、 大 小 和 所 有 者 等 。 另 外 ， 为 了 文 持 别名 ， 索 引 贡 点 还 有 一 个 引用 计数 
字段 。 

图 11-11 显示 了 文件 /users/faculty/rama/foo 的 完整 索引 节点 结构 。 为 了 简单 起 见 ， 此 处 省 
略 了 数据 块 。 | 

图 11-12 显示 了 用 bar 作为 foo 的 硬 链接 的 索引 节点 结构 。 两 个 文件 共享 相同 的 索引 市 
点 。 因 此 ， 索 引 节点 上 的 引用 计数 字段 的 值 为 2。 图 11-13 是 第 三 个 文件 baz 为 /users/faculty/ 
rama/foo 的 软 链接 时 的 索引 节点 结构 。baz WAS HE 是 一 个 软 链接 并 且 包 含 了 文件 名 
/users/faculty/rama/foo。 文 件 系 统 用 软 链 接 提 供 的 文件 名 开始 遍历 索引 节点 结构 (例如 ， 本 例 
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中 访问 baz 时 ， 将 从 /的 索引 节点 开始 )。 


/users/faculty /users/faculty/rama /users/faculty/rama/too 


/for 的 索引 节点 的 索引 节点 ane 点 的 索引 节点 


文件 名 mh 











aco 


图 11-11 UNIX 中 层次 化 命名 的 一 个 简化 的 索引 节点 结构 ( /users/faculty/rama/foo 文件 
通过 一 系列 文件 创建 )。 






/users/faculty/rama/foo 

/users/faculty/rame/bar 
/users/faculty/rama HEF Biza 
的 索引 节点 引用 计数 =2 













类 型 = 目录 


索引 节 
文件 名 


类 型 = 数据 文件 
P 


图 11-12 ”两 个 文件 foo 和 bar 共享 一 个 索引 节点 (两 者 之 间 是 便 链 接 ， 通 过 “ In foo bar” 
命令 创建 ) 


当前 目录 是 /tmp, /tmp 的 索引 节点 是 20。 
在 当前 目录 下 被 执行 的 UNIX 命令 : 


touch foo /* 在 当前 目录 下 创建 一 个 零 字 节 的 文件 */ 

ln foo bar /* 创建 一 个 硬 链接 */ 

In —s /tmp/foo baz /* 创建 一 个 软 链接 */ 

ln baz gag /* 创建 一 个 硬 链接 */ 

注意 : 

。 索引 节点 的 类 型 可 以 是 目录 文件 、 数 据 文 件 、 软 链接 之 一 。 


。 如 果 类 型 是 软 链接 ， 那 么 你 不 得 不 提供 与 软 链接 相关 联 的 名 称 ; 和 否则， 索引 节点 中 的 名 称 字段 为 空 。 
。 引用 计数 是 一 个 非 零 的 正 整数 。 
将 内 容 填 入 下 图 的 空格 来 完成 索引 节点 的 信息 。 


/tmp 的 索引 节点 





W 


/tmp RIIT A 





20| 类 型 = directory file 








给 定 下 列 命令 ， 说 出 索引 节点 的 内 容 。 为 了 简化 问题 ， 你 可 以 自 定 索引 节点 的 磁盘 块 地 址 。 请 给 出 
节点 的 引用 计数 。 


touch /tmp/foo 

mkdir /tmp/bar 

mkdir /tmp/bar/gag 

ln /tmp/foo /tmp/bar/foo2 

ln -s /tmp/foo /tmp/bar/foo 

ln /tmp/foo /tmp/bar/gag/foo 

ln -s /tmp/bar /tmp/bar/gag/bar 
ln -s /tmp /tmp/bar/gag/tmp 


索引 


注意 : 

。“mkdir” 创 建 一 个 目 隶 。 
。“touch” 创 建 一 个 零 字 节 的 文件 。 

。“In” 是 链接 命令 (-s 表明 是 符号 链接 也 称 为 软 链接 )。 
假设 前 面 的 文件 和 目录 是 文件 系统 中 仅 有 的 文件 和 目录 。 
Se. 


ao. 


地 址 0 地 址 10 地 址 100 
/ 的 索引 节点 /tmp WRI Ra /tmp/foo 的 索引 节点 


refont -3 





494 
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Hh tt 20 /tmp/bar/gag 
/tmp/bar 的 索引 节点 的 索引 节点 





此 时 执行 下 述 命令 : 
rm /tmp/bar/foo 


请 给 出 索引 节点 的 新 内 容 ( 仅 将 受 影响 的 索引 节点 的 内 容 写 出 即 可 )。 
答 ， 


只 有 /tmp/bar 的 索引 节点 发 生 了 如 下 所 人 述 的 变化 。 需 要 将 符号 链接 项 从 索引 节点 中 移 除 。 


地 址 20 
/tmp/bar 的 索引 节点 





关于 图 11-13， 我 们 首先 看 一 看 ， 如 果 文 件 bar 被 删除 了 会 对 索引 节点 有 什么 影响 。 将 / 
user/faculty/rama 的 索引 节点 项 bar 移 除 ，/users/faculty/rama/foo 索引 节点 ( 块 30) 的 引用 计 
数 将 字段 减 1 ( 即 新 的 引用 计数 将 等 于 1 )。 


/users/faculty/rama/foo 
/users/faculty/rama/bar 


的 索引 节点 


引用 字数 =2 


/users/faculty/rama 







/users/faculty/rama/baz 


的 索引 节点 
引用 计数 =1 
类 型 = 符号 链接 | 








图 11-13 baz 是 文件 /users/faculty/rama/foo 的 软 链接 (通过 命令 “ In -s /users/faculty/ 
rama/foo baz” 创 建 ) 
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然后 ， 我 们 看 看 当 bar 和 foo 都 被 删除 后 索引 节点 结构 又 会 有 什么 改变 。 图 11-14 描述 了 
这 种 情形 。 在 删 BR bar 和 foo 后 ， 由 FR 30 /users/faculty/rama 
的 引用 计数 值 变 为 0， 所 以 文件 系统 将 把 块 的 索引 节点 
30 放 回 空闲 链表 中 。 注 意 baz 依 然 存 在 于 / 
users/faculty/rama 下 。 这 是 因为 文件 系统 只 检 
查 在 创建 符号 软 链接 时 建立 的 别名 的 有 效 性 。 
但 是 ,注意 此 时 该 名 称 的 索引 节点 (此 处 的 
“foo”) 信息 已 经 不 存在 了 。 因 此 ， 文件 系 统 
没有 办 法 在 删除 文件 (此 处 的 “foo”) 时 检查 
指向 文件 的 符号 链接 是 否 存在 。 然 而 ,任何 Den 
尝试 获取 baz 内 容 的 操作 都 会 发 生 错误 ， 因 为 ds 
就 文件 系统 而 言 ， 文 件 /users/faculty/rama/foo 
已 经 不 存在 了 。 这 说 明 我 们 在 使 用 符号 链接 时 需要 小 心 谨慎。 


/users/faculty/rama/ 
baz 的 索引 节点 


引用 计数 =1 
类 型 = 符号 链接 








Rie 





考虑 下 列 命 令 : 

touch foo; /* 创建 一 个 零 字 节 文 件 */ 

ln foo bar; /* 创建 foo 的 一 个 硬 链 接 bar */ 
ln -s foo baz; /* 创建 foo 的 一 个 软 链接 baz */ 
rm foo; /* 删除 文件 foo */ 

当 执 行 下 列 命令 时 会 发 生 什 么 ? 

cat baz; /* 查看 并 输出 文件 baz 的 内 容 */ 
A 


i=] 


假设 所 有 之 前 操作 发 生 的 位 置 ， 即 当前 目录 ， 为 tmp。 在 这 个 例子 中 ，foo、bar、baz 都 在 tmp 的 
索引 节点 中 创建 。 

假设 foo 的 索引 节点 为 20。 当 我 们 创建 硬 链 接 bar 时 ， 索 引 节 点 20 的 引用 计数 变 为 2。 当 foo 被 
删除 后 ， 索 引 节点 的 引用 计数 降 到 1， 但 是 索引 节点 并 没有 被 删除 ， 因 为 bar 还 有 一 个 指向 它 的 硬 链接 。 
但 是 ，foo 从 当前 目录 的 索引 节点 中 删除 了 。 

因此 ， 当 我 们 尝试 通过 cat 命令 查看 文件 baz 的 内 容 时 ， 文 件 系统 会 发 生 错误 ， 因 为 文件 foo 已 经 
不 再 存在 于 当前 目录 中 了 。 下 图 说 明了 具体 的 情况 。 

tmp 的 索引 节点 /tmp/bar 的 索引 节点 


类 型 = 数据 文件 








/tmp/baz 的 索引 节点 
引用 计数 =1 


类 型 = 符号 链接 








Fak 
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11.3.1 索引 节点 


在 UNIX 中 ， 每 个 文件 有 一 个 与 之 相关 联 的 唯一 编号 ， 称 作 索 引 节点 编号 。 你 也 许 会 把 
这 个 编写 当 作 保存 与 文件 相关 联 的 所 有 信息 (所 有 者 、 大 小 、 名 称 等 ) 的 表 的 索引 。 当 UNIX 
系统 发 展 后 ， 与 每 个 文件 有 关 的 信息 的 复杂 度 也 随 之 扩展 了 (例如 ,文件 名 可 以 任意 长 等 )。 
因此 ， 在 现代 的 UNIX 系统 中 ， 每 个 文件 用 占据 了 一 整 块 磁盘 块 的 唯一 的 索引 节点 数据 结构 
来 表示 。 索 引 节 点 集 构成 了 一 张 届 和 辑 表 ， 索 引 节 点 编号 是 这 个 磁盘 块 的 地 址 ， 它 可 以 用 来 作 
为 这 张 逻辑 表 的 索引 ， 并 包含 了 那个 特定 文件 的 信息 。 为 了 方便 文件 系统 的 实现 ， 所 有 索引 
节点 在 文件 系统 中 占据 物理 介质 上 空间 相 邻 的 位 置 。 这 隐 式 地 限制 了 文件 系统 能 够 保存 的 最 
大 文件 数目 。 习 惯 上 ， 通 过 存储 分 配 算法 维护 〈 每 个 索引 节点 一 位 ) 的 位 天 量 用 来 指定 茶 个 
特定 的 索引 节点 是 否 被 使 用 了 。 这 就 允许 在 处 理 文件 创建 请 求 时 能 够 有 效 地 分 配 索引 节点 。 
类 似 地 ， 为 了 有 效 地 进行 存储 分 配 ， 人 存储 管理 融 在 磁盘 上 用 位 天 量 实现 了 数据 块 的 空闲 链表 
(每 一 位 表示 一 个 特定 的 数据 块 是 否 被 使 用 或 者 不 在 介质 上 )。 


11.4 文件 系统 的 组 件 


尽管 文件 系统 可 以 在 用 户 层 实现 ， 但 通常 它 并 不 属于 操作 系统 。 图 11-15 展示 了 磁盘 上 
文件 系统 的 层次 结构 。 我 们 把 管理 文件 系统 的 操作 系统 部 分 称 作 文件 系统 (FS) PHB. N 
了 便于 说 明 ， 我 们 把 文件 管理 囊 分 成 以 下 几 层 : 





图 11-15 磁盘 文件 系统 管理 器 的 层次 结构 图 


。 媒介 独立 层 : 这 一 层 由 用 户 接口 组 成 一 一 提供 给 用 户 的 应 用 程序 接口 (API)。API 模块 
向 用 户 程序 提供 文件 系统 命令 让 其 能 够 对 文件 进行 打开 、 关 闭 、 读 、 写 等 操作 。 这 一 
层 也 包括 了 名 称 解析 器 模块 ， 它 将 用 户 提 供 的 名 称 转换 为 对 文件 系统 而 言 有 意义 的 内 
部 表示 。 例 如 ， 它 可 能 把 用 户 文件 名 (例如 ，E:myphotos) 映射 到 文件 指定 设备 上 ( 例 
i, ÉA., CD, WHE). 

。 媒 介 存 储 空间 分 配 层 : 这 一 层 将 (文件 创建 时 的 ) 空间 分 配 、( 文 件 删除 时 的 ) 空间 回收 、 
空闲 链表 维护 以 及 其 他 与 管理 物理 设备 空间 有 关联 的 功能 进行 了 具体 化 的 实现 。 例 如 ， 
如 果 在 磁盘 上 存在 文件 系统 ， 那 么 数据 结构 和 算法 就 会 使 用 11.2 节 讨 论 的 分 配方 案 。 


*。 设备 驱动 器: 这 一 部 分 处 理 与 设备 通信 的 命令 ， 以 及 在 设备 和 操作 系统 缓冲 区 之 间 发 
生 的 数据 传输 。 设 备 驱 动 器 的 细节 (第 10 章 中 包含 了 设备 驱动 器 的 一 些 信息 ) 取决 于 
文件 系统 位 于 的 大 容量 存储 设备 。 

。 媒介 请 求 调度 层 : 这 一 层 负 责 调 度 操 作 系 统 发 来 的 请 求 ， 使 其 符合 设备 的 物理 性 能 。 
例如 ， 对 于 磁盘 ， 这 一 层 将 实现 第 10 章 介 绍 的 磁盘 调度 算法 。 如 我 们 在 第 10 章 见 到 
的 ， 即 使 是 磁盘 ， 调 度 算法 可 能 实际 上 就 在 作为 驱动 器 一 部 分 的 设备 控制 器 中 。 调 度 
算法 可 能 会 相当 不 同 ， 这 取决 于 该 大 容量 存储 设备 的 特点 。 

图 11-15 显示 了 软件 栈 底 三 层 的 例子 ， 每 个 例子 是 给 用 户 提供 的 文件 系统 接口 的 大 容量 

存储 设备 。 因 此 ， 文件 是 一 种 强 有 力 的 抽象 ， 其 隐藏 了 所 属 物理 设备 上 的 具体 细节 。 


11.4.1 创建 、 与 入 文件 的 剖析 


假设 程序 发 出 了 一 个 IO 请 求 要 在 硬盘 上 创建 一 个 文件 。 下 列 步 又 跟踪 了 当 这 样 的 IO 请 
求 从 图 11-15 的 软件 层 发 出 所 经 过 的 路 径 : 

1) 创建 文件 调用 的 API 例 程 通过 检查 许可 、 访 问 权 限 和 其 他 与 该 请 求 有 关 的 信息 来 检验 
请 求 是 否 合法 。 检 验 通 过 后 ， 它 调用 名 称 解 析 妖 。 

2) 名 称 解析 器 告诉 存储 分 配 模块 为 新 文件 分 配 一 个 索引 节点 。 

3 ) 存储 分 配 模块 从 空闲 链表 中 得 到 一 个 磁盘 块 并 将 其 返回 给 名 称 解 析 器 。 存 储 分 配 模块 
通过 与 分 配方 案 相 符合 的 方式 填充 索引 节点 ( 见 11.2 节 )。 假 设 我 们 使 用 混合 方案 进行 分 配 
(UL 11.2.7 节 )。 由 于 文件 创建 时 还 没有 任何 数据 ， 所 以 文件 不 会 分 配 任何 数据 块 。 

4) 名 称 解 析 器 创建 一 个 目录 项 并 将 名 称 记 录 到 索引 节点 中 ， 将 信息 映射 到 目录 的 新 文件 中 。 

注意 这 些 步骤 并 没有 真正 涉及 设备 ， 因 为 文件 系统 访问 的 数据 结构 都 在 内 存 中 。 

现在 假设 程序 向 刚 创 建 的 文件 进行 写 操 作 。 我 们 来 跟踪 这 个 操作 在 软件 层 中 的 执行 过 程 。 

1) 与 前 面 一 样 ， 写 文件 的 API 例 程 检查 该 请 求 的 合法 性 。 

2) 名 称 解 析 器 将 内 存 缓冲 区 与 文件 的 索引 节点 信息 一 起 传送 给 存储 分 配 模 块 。 

3 ) 存储 分 配 模 块 从 空闲 链表 中 分 配 与 写 入 信息 大 小 相当 的 数据 块 ， 然 后 向 磁盘 发 出 写 请 
求 并 将 该 请 求 交 给 设备 驱动 需 。 

4) 设备 驱动 器 将 请 求 放 人 请 求 队列 。 设 备 驱动 器 与 磁盘 调度 算法 一 起 完成 写 文件 到 磁盘 
的 操作 。 

5) 文件 写 入 完成 后 ， 设 备 驱动 器 得 到 一 个 来 自 文 件 系 统 返回 给 磁盘 控制 顺产 生 的 中 断 ， 
然后 与 CPU 调度 器 通信 后 继续 从 文件 写 的 地 方向 下 执行 你 的 程序 。 

应 当 注意 到 ， 就 操作 系统 而 言 ， 当 请 求 提 交 到 设备 驱动 需 后 写 文件 的 调用 束 完 成 了 。 这 
个 调用 的 成 功 或 失败 在 之 后 控制 器 进行 中 断 时 我 们 就 会 知道 。 文 件 系统 与 CPU Wal BE ait SCA 
方式 与 内 存 管理 器 一 样 ( 见 8.2 节 )。 为 了 处 理 页 错误 ， 内 存 管 理 需 发 送 一 个 与 错误 进程 有 关 
的 IO 请 求 。 当 IO 请 求 完成 后 ， 就 会 通知 内 存 管理 器 ， 告诉 CPU 调度 器 继续 故障 进程 的 执 
行 。 这 也 是 文件 系统 的 处 理 方 式 。 


1.5 “各 种 子 系统 的 交互 


探究 目前 我 们 已 经 涉及 的 操作 系统 的 各 种 软件 子 系统 会 很 有 意思 : CPU VAR RE. MEA 
存 (VM) 管理 器 、 文 件 系统 (FS) 管理 器 以 及 各 种 输入 /输出 设备 的 驱动 器 。 
当然 ， 所 有 的 这 些 子 系统 都 为 用 户 程序 服务 。 例 如 ，VM 管理 器 处 理 用 户 程序 的 页 错误 ， 
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通过 隐 式 地 调用 与 该 故障 进程 有 关 的 IO 请 求 。 文 件 管理 器 显 式 地 发 出 IO 请 求 来 完成 用 户 程 
序 关 于 读 / 写 文件 的 请 求 。 在 这 两 个 例子 中 ，1/O 操作 的 对 象 是 某 个 大 容量 存储 设备 (硬盘 、 
WF. CD, DVD 等 )。 与 特定 VO 请 求 相 关 的 设备 驱动 器 执行 VO 请 求 并 将 VO 操作 的 结果 
报告 给 请 求 者 。 

设备 驱动 器 需要 确定 从 设备 控制 器 发 来 的 O 完成 中 断 是 谁 的 IO 请 求 。 一 个 简单 上 且 统 一 
的 方法 是 使 用 6.4 市 介绍 的 PCB 数据 结构 作为 这 些 子 系统 之 间 通 信 的 中 介 。 

例如 ， 文 件 系统 管理 器 的 顶层 通过 进程 的 PCB 将 文件 IO 请求 交 给 设备 驱动 器 。 这 么 做 
很 直截了当 ， 而 且 与 过 程 调用 很 相似 ， 除 了 过 程 调用 穿 过 图 11-15 中 软件 栈 的 各 个 层 外 。 信 
息 流 如 图 11-16a 所 示 。PCB, 表示 发 出 文件 系统 调用 的 进程 的 PCB。 一旦 调用 提交 给 设备 驱 
动 锅 ， 进 程 就 不 再 运行 了 ,图 11-16b 中 有 相关 描述 。PCB, 在 由 设备 驱动 器 进行 服务 时 位 于 
Disk IO q 中 。 

当 IO 完成 后 ,设备 驱动 带 需 要 通知 系统 软件 栈 的 上 层 。 在 第 6 章 中 ( 见 6.7.1 节 )， 我 们 
介绍 了 回调 。 这 是 系统 软件 栈 中 低层 调用 上 层 的 机 制 。 事 实 上， 从 图 11-6c 中 可 以 看 到 ， 回 
调 是 连续 的 。 首 先 ， 磁 盘 控制 器 通过 中 断 的 形式 回 设 备 控制 右 的 中 断 处 理 需 发 出 一 个 回调 。 
中 断 处 理 需 确切 地 知道 这 个 IO 是 从 哪个 与 之 相关 的 进程 发 起 的 (从 Disk IO q)。 当 然 ， 设 
备 驱 动 器 中 的 中 断 处 理 需 需要 了 解 是 谁 调用 的 。 基 于 这 个 理由 ， 每 个 系统 栈 中 的 上 层 需要 给 
低层 注册 一 个 处 理 器 来 允许 回调 。 通 过 这 个 处 理 器 ， 设 备 驱 动 器 向 文件 系统 管理 器 发 出 回调 
来 指明 文件 IO 请 求 的 完成 情况 。 我 们 可 以 看 到 这 种 回调 机 制 与 硬件 中 断 (参见 第 4 章 ) 之 间 
的 相似 性 。 两 者 在 功能 方面 具有 相似 性 (与 系统 进行 异步 的 通信 事件 )， 在 传达 这 种 事件 的 机 
制 方 面 也 有 相似 之 处 ， 因 此 回调 也 通常 称 作 软 件 中 断 。 





CPU 调度 器 
d 


a) 文件 系统 调用 的 信息 流 


图 11-16 
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c) 文件 IO 请 求 完 成 的 一 系列 回调 (磁盘 控制 器 指向 设备 控制 器 的 上 箭头 在 硬件 中 ; 从 设备 控制 器 
到 文件 系统 管理 器 的 上 箭头 在 软件 中 ) 


图 11-16 ( 续 ) 
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d) FRR EMIRA T LO 请 求 的 进程 (PCB1 ) 放 回 CPU AY ready q 中 
图 11-16 (22) 


在 收 到 回调 后 ， 文 件 系 统管 理 右 将 请 求 进程 的 PCB ( PCB, ) 重新 存 人 CPU 调度 器 的 
ready_q， 如 图 11-6d Pras. 

我 们 可 以 看 到 ， 操 作 系 统 组 件 之 间 的 交互 是 通过 用 PCB 的 形式 对 执行 程序 进行 抽象 来 平 
滑 地 实现 的 。 这 就 是 PCB 抽象 的 威力 。 

类 似 序 列 事件 会 在 一 个 进程 出 现 页 错误 时 发 生 ; 唯一 的 区 别 是 虚拟 存储 管理 器 是 图 11-16a~d 
中 软件 栈 中 上 下 各 个 动作 的 发 起 者 。 


11.6 文件 系统 在 物理 媒介 上 的 布局 


我 们 来 看 一 看 操作 系统 如 何在 开机 加 电 后 控制 系统 中 的 资源 。 

在 第 10 章 中 ,我 们 提 到 了 操作 系统 启动 后 的 基本 思想 。 我 们 将 解释 BIOS 如 何 进行 设备 
的 基础 初始 化 并 将 控制 交 给 系统 软件 的 更 高 层 。 实 际 上 ， 这 会 涉及 操作 系统 启动 过 程 。 操 作 
系统 的 映像 放 在 大 容量 存储 设备 中 。 事 实 上 , BIOS 甚至 不 了 解 操 作 系 统 启动 需要 什么 。 因 此 ， 
BIOS 需要 清楚 地 知道 信息 存储 在 哪里 以 及 在 大 容量 存储 设备 中 怎样 存放 ， 这 样 它 就 可 以 读 操 
作 系 统 并 将 控制 权 交 给 它 。 换 句 话 说 ， 大 容量 存储 设备 上 的 信息 布局 成 为 BIOS 和 操作 系统 
之 间 的 协议 ， 无 论 是 Windows Linux 或 是 其 他 操作 系统 。 

为 了 更 具体 地 说 明 ， 我们 假定 大 容量 存储 设备 是 一 个 磁盘 。 在 磁盘 存储 空间 的 最 开始 位 
置 ， 我 们 将 其 称 作 { 盘面 0， 盘 道 0， 扇 区 0}， 它 是 一 个 叫做 主 引 导 记 录 ( MBR) 的 特殊 记 
录 。 当 你 通过 编译 过 程 创建 一 个 可 执行 程序 时 ， 直 到 加 载 絮 将 其 加 载 到 内 存 ， 这 个 程序 一 直 
放 在 磁盘 上 。 同 样 ，MBR 只 是 一 个 放 在 磁盘 上 已 知 单元 的 程序 。BIOS 作为 加 载 磊 将 这 个 程 
序 加 载 和 内存， 然后 将 控制 权 交 给 MBR。 

MBR 程序 知道 磁盘 上 剩余 内 容 的 布局 ， 并 且 知 道 操 作 系 统 在 磁盘 上 的 确切 人 位置。 物理 磁 
盘 本 身 可 能 分 成 了 多 个 分 区 。 例 如 ， 在 台式 计算 机 或 笔记 本 电脑 上 ， 你 可 能 见 过 名 称 不 同 的 
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a “Koh ae” (GEKA Windows 将 其 用 C、D 等 进行 命名 )。 这 些 可 能 是 不 同 的 物理 驱动 器 ， 
但 也 可 能 只 是 逻辑 驱动 器 ， 每 个 对 应 同一 个 物理 驱动 器 上 的 某 个 独立 分 区 。 我 们 假设 有 一 个 
单独 的 磁盘 ， 但 是 能 够 双 启 动 : 可 以 让 Linux 和 Windows 成 为 你 的 操作 系统 ， 这 只 取决 于 你 
的 选择 。 每 个 操作 系统 的 文件 系统 当然 也 可 以 不 同 。 这 就 是 分 区 的 作用 。 

图 11-17 显示 了 磁盘 的 一 个 概念 布局 。 为 了 清晰 地 描述 ， 我 们 将 每 个 分 区 放 在 不 同 的 磁 
盘 盘 面 上 。 然 而 ， 需 要 强调 的 是 ， 每 个 盘面 可 能 有 若 多 分 区 ， 这 取决 于 磁盘 容量 。MBR 程序 
的 关键 数据 结构 是 分 区 表 。 这 张 表 ( 见 表 11-4) 给 出 了 每 个 磁盘 分 区 的 设备 开始 和 设备 结束 
地 址 (例如 ， 用 三 元 组 { 盘面 ， 盘 道 ， 扇 区 } 的 形式 )。 根 据 用 户 在 启动 时 的 选择 ，MBR 通 
过 分 区 表决 定 激活 哪个 分 区 。 当 然 ， 在 有 些 系统 上 可 能 没有 选择 (例如 ， 只 有 一 个 分 区 , 或 
者 只 有 一 个 分 区 有 与 其 关联 的 操作 系统 )。 


{盘面 0, 磁 道 0， 
局 区 0} 





图 11-17 磁盘 上 信息 的 概念 布局 。 在 每 个 磁盘 的 盘面 上 可 能 有 一 个 或 多 个 分 区 


R 11-4 显示 了 多 个 分 区 。 根 据 需要 局 动 的 操作 系统 ，MBR 程序 将 激活 相应 的 分 区 (在 本 
例 中 ， 即 分 区 1 或 2 )。 注 意 分 区 3 ~ 5 并 没有 与 之 关联 的 操作 系统 。 它 们 只 是 给 其 中 之 一 或 
其 他 操作 系统 使 用 的 逻辑 “驱动 右 ”。 


表 11-4 分 区 表 数 据 结构 


分 区 开始 地 址 { Ge, REI, BAK } 结束 地 址 { 盘面 ， 磁道， 扇 区 } 操作 系统 


; 
1 x 
s 天 


图 11-18 是 每 个 分 区 的 信息 布局 。 除 了 第 一 项 (启动 块 外 )， 分 区 的 实际 信息 布局 在 各 个 
文件 系统 之 间 是 不 同 的 。 然 而 ， 为 了 更 具体 一 些 ， 我 们 假定 了 一 个 特定 的 布局 并 描述 了 每 项 
的 功能 。 图 11-18 选择 的 信息 布局 与 传统 的 UNIX 文件 系统 非常 相近 。 

我 们 来 看 一 下 分 区 中 的 每 项 : 

。 启动 块 是 每 个 分 区 中 的 第 一 项 ，MBR 从 被 激活 分 区 的 启动 块 读 取 数据 。 启 动 块 是 负责 

加 载 与 该 分 区 相关 联 的 操作 系统 的 程序 (就 像 MBR 一 样 )。 为 了 一 致 性 ， 每 个 分 区 都 
有 一 个 启动 块 ， 即 使 在 一 个 特定 的 分 区 中 根本 没有 与 之 关联 的 操作 系统 ( 见 表 11-4 中 
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的 分 区 3 ~ 5 )。 

o 超级 块 包含 了 所 有 与 该 分 区 所 含 操作 系统 相关 的 信息 。 这 是 了 解 该 分 区 其 余部 分 布局 
的 关键 。 启 动 程序 (除了 加 载 操 作 系 统 ， 或 替代 之 外 ) 把 超级 块 读 入 内 存 。 通 常 ， 它 包 
含 了 一 个 代码 ， 通 常 也 称 作 魔 数 ， 它 表明 该 分 区 中 文件 系统 的 类 型 。 它 还 包含 了 磁盘 
块 个 数 ， 以 及 其 他 与 文件 系统 有 关 的 管理 信息 。 

。 分 区 中 的 下 一 项 包含 了 该 分 区 中 用 于 存储 管理 的 数据 结构 。 这 些 数 据 结 构 与 文件 系 
统 采用 的 特定 分 配 策略 有 关 ( 见 11.2 节 )。 例 如 ， 它 可 能 包含 表示 所 有 可 用 磁盘 数据 
块 ( 比 如 ,空闲 链表 ) 的 位 映射 。 作 为 男 一 个 例子 ， 这 项 中 可 能 还 包含 我 们 之 前 提 过 的 
FAT 数据 结构 CU 11.2.4 节 )。 
© 分 区 中 的 下 一 项 对 应 于 文件 系统 维护 的 每 个 文件 信息 。 这 个 数据 结构 与 文件 系统 的 特 
性 有 关 。 例 如 ， 在 11.3.1 市 的 UNIX 文件 系统 中 ， 每 个 文件 有 一 个 与 之 关联 的 唯一 编 
号 ， 也 称 案 引 节 点 号 。 在 这 样 的 系统 中 ， 这 项 可 能 是 文件 系统 中 所 有 索引 节点 的 集合 。 
。 现代 文 件 系统 都 是 层次 化 的 。 分 区 中 的 下 一 项 指向 了 层次 化 树 状 文件 系统 的 根 目 录 。 
例如 ,在 UNIX 中 ， 它 对 应 于 目录 “/”。 

。 分 区 中 的 最 后 一 项 是 用 于 存储 数据 和 目录 文件 的 磁盘 块 集合 。 分 区 中 存储 管理 项 的 数 
据 结构 负责 分 配 /回收 这 些 磁盘 块 。 它 们 可 能 用 于 存储 数据 (例如 ， 一 张 JPEG 图 像 ) 
或 者 包含 了 其 他 文件 ( 即 数 据 文件 或 其 他 子 目录 ) 的 目录 。 





图 11-18 每 个 分 区 的 布局 。 分 区 中 的 项 只 是 存储 管理 融 用 于 组 织 磁盘 信息 的 数据 结构 


显而易见 ， 超 级 块 是 文件 系统 的 一 个 关键 数据 结构 。 如 果 由 于 某 些 原因 将 其 损坏 了， 那 
么 就 很 难 恢复 文件 系统 的 内 容 。 


11.6.1 内存 中 的 数据 结构 


为 了 更 具 效 率 ， 文 件 系 统 会 在 启动 时 把 关键 的 数据 结构 (超级 块 、 索 引 市 点 的 空闲 链表 
以 及 数据 块 的 空闲 链表 ) 从 磁盘 读 取 进 来 。 当 用 户 程序 创建 和 删除 文件 时 ， 文 件 系 统 就 会 处 
理 这 些 存放 在 内 存 中 的 数据 结构 。 事 实 上 ， 文 件 系统 甚至 不 会 马上 将 创建 的 数据 文件 写 入 大 
容量 存储 设备 。 这 种 延 后 有 两 方面 的 原因 。 首 先 ， 大 量 的 文件 ， 尤 其 是 在 程序 开发 环境 里 ， 
都 只 有 较 短 的 生命 周期 (小 于 30 秒 )。 考 虑 那些 在 程序 编译 和 链接 过 程 中 创建 的 中 间 文 件 。 
创建 这 些 文件 的 程序 (例如 ， 编 译 器 和 链接 器 ) 在 创建 完 执行 文件 后 就 会 将 它们 删除 。 因 此 ， 
过 一 会 儿 再 执行 向 大 容量 存储 设备 的 写 人 操作 会 有 一 定好 处 ， 因 为 这 种 延迟 可 以 帮助 减少 IO 
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数据 量 。 其 次 ， 是 为 了 方便 和 效率 。 文 件 系统 可 以 批量 地 进行 IO 请 求 ， 从 而 既 可 以 减少 单 
独 发 出 请 求 的 开销 ， 又 可 以 较 好 地 处 理发 自 设备 IO 的 中 断 。 

这 种 策略 也 有 坏处 。 内 存 中 的 数据 结构 与 它们 在 磁盘 上 的 对 应 部 分 有 不 一 致 之 处 。 当 党 
试 从 计算 机 中 拔 掉 内 存 条 时 ,我们 注意 到 计算 机 屏幕 上 显示 消息 “ 移 除 设备 不 安全 ”。 这 是 因 
为 操作 系统 还 没有 将 这 些 内 存 中 的 数据 结构 (甚至 于 数据 自身 ) 的 变化 提交 到 大 容量 存储 设备 
上 。 大 多 数 操作 系统 都 提供 了 强制 执行 的 命令 。 例 如 ，UNIX 中 的 syne 命令 可 以 强制 把 所 有 
内 存 绥 冲 区 中 的 数据 写 到 大 容量 存储 设备 上 。 


11.7 AbTHAS ARIS 


我 们 来 看 一 看 操作 系统 关 溃 究竟 是 什么 意思 。 我 们 经 常 说 ， 操 作 系 统 是 一 个 程序 。 它 
与 你 可 能 写 过 的 其 他 部 分 软件 一 样 容易 发 生 故 障 。 如 果 一 个 用 户 程 序 做 了 一 些 它 不 应 当做 
的 事 〈 例 如 ， 答 试 访 问 一 部 分 超过 其 边界 的 内 存 ) 就 会 被 操作 系统 终止 ， 或 者 这 个 程序 可 
能 会 因为 需要 等 一 个 永远 不 会 发 生 的 事件 而 挂 起 。 操 作 系统 也 可 能 产生 这 种 错误 ， 也 可 能 
突然 终止 执行 。 另 外 ， 电 源 故 隐 会 强制 性 地 导致 操作 系统 的 执行 被 终止 。 这 就 是 所 谓 的 系 
ARK o 

文件 系统 是 计算 机 系统 的 一 个 关键 部 件 。 由 于 它 存放 了 永久 性 数据 ， 所 以 其 稳定 性 对 于 
任何 企业 的 生产 力 而 言 都 是 最 为 重要 的 。 因 此 ， 文 件 系 统 能 够 在 系统 月 演 后 继续 正常 工作 就 
非常 重要 了 。 操 作 系 统 非常 小 心地 保证 文件 系统 的 完整 性 。 如 果 系 统 意外 地 朋 演 了 ， 那 么 在 
崩 浊 时 存储 于 内 存 中 的 数据 结构 与 磁盘 上 的 版 本 束 会 产生 不 一 致 性 。 

基于 这 种 原因 ， 作 为 一 种 最 后 手段 ， 操 作 系 统 会 在 终止 前 (无论 骨 浊 是 由 操作 系统 漏洞 
还 是 电源 故障 引起 的 ) 把 内 存 的 内 容 导 出 到 大 容量 存储 设备 的 某 个 已 知 位 置 上 。 系 统 启动 时 ， 
启动 程序 最 先 做 的 一 件 事 情 就 是 查看 是 否 有 这 样 的 崩 当 映像。 如 果 有 ， 那 么 它 就 会 尝试 重建 
存储 在 内 存 中 的 数据 结构 并 让 磁盘 上 的 版 本 与 之 吻合 。 人 台式 计算 机 启动 时 会 花 一 点 儿 时 间 的 
一 个 原因 就 是 操作 系统 需要 进行 一 致 性 检查 来 保证 系统 完整 性 。UNIX 操作 系统 目 动 在 启动 
时 进行 文件 系统 一 致 性 检查 (fsck)。 只 有 当 系 统 通过 了 一 致 性 检查 后 司 动 过 程 才 会 继续 下 去 。 
企业 都 会 进行 磁盘 往 磁 带 上 周期 性 的 备份 来 避免 故障 。 


11.8 ”其 他 物理 媒介 上 的 文件 系统 


到 目前 为 止 ， 我 们 都 假设 物理 媒介 是 磁盘 。 我 们 知道 文件 系统 可 以 存放 在 各 种 物理 媒介 
上 。 如 果 大 容量 存储 器 的 物理 媒介 不 同 ， 我 们 目前 讨论 的 内 容 在 什么 程度 上 会 发 生 改 变 呢 ? 
CD-ROM 和 CD-R (可 刻录 CD) 可 能 是 最 简单 的 。 一 旦 刻录 后 ， 文 件 就 不 会 在 这 种 媒介 中 被 
清除 ， 这 就 简化 了 文件 系统 的 复杂 度 。 例 如 ， 对 于 前 者 ，CD 上 就 无 需 空闲 链表 ; 相 比 之 下 ， 
后 者 的 所 有 空闲 空间 都 在 CD 的 尾部 ， 可 以 将 文件 加 到 后 面 。CD-RW (可 重 写 CD) 的 文件 系 
统 就 稍微 复杂 一 些 ， 因 为 删除 文件 的 空间 需要 被 放 回 到 媒介 的 空闲 空间 上 。DVD 的 文件 系统 
也 类 似 。 

在 第 10 章 中 提 到 ， 固 态 硬盘 (SSD) 当前 正 与 磁盘 在 大 容量 存储 媒介 上 进行 竞争 。SSD 
可 以 随机 访问 ， 所 以 磁盘 块 的 寻 道 时 间 (在 基于 磁盘 的 文件 系统 中 一 个 主要 担心 的 问题 ) 在 基 
于 SSD 的 文件 系统 中 就 不 是 特别 令 人 担心 。 因 此 ， 在 分 配 策略 上 就 有 一 定 的 机 会 进行 简化 。 
然而 ， 对 于 SSD 的 文件 系统 实现 也 有 一 些 特别 需要 考虑 的 地 方 。 例 如 ，SSD 的 一 个 给 定 区 域 
(通常 指 一 块 ) 只 能 进行 有 限 次 的 写 和 信 ， 之 后 就 会 不 可 用 。 这 是 由 SSD 技术 特点 决定 的 。 因 
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UE, SSD 的 文件 系统 采用 损耗 均衡 的 分 配 策略 来 保证 所 有 的 存储 区 域 在 SSD 的 生命 周期 中 被 
均衡 地 使 用 。 


11.9 现代 文件 系统 一 览 

本 市 我 们 将 人 研究 一 些 现代 文件 系统 演变 中 一 些 令 人 兴奋 的 新 发 展 。 第 6 章 中 ,我 们 从 历 
史 的 角度 介绍 了 UNIX 系统 的 发 展 以 及 它 如 何 为 Linux 和 Mac OS X 铺 平 了 道路 。 现 在 ，Mac 
OS X., Linux 和 Windows 已 经 在 各 种 应 用 领域 占领 了 广泛 的 市 场 。 这 里 ， 我 们 将 我 们 的 讨论 
集中 在 Linux 和 微软 系列 操作 系统 的 文件 系统 上 。 


11.9.1 Linux 


Linux 提供 的 文件 系统 接口 ( 即 API) 与 早期 UNIX 系统 相 比 并 无 太 大 改变 。 然 而 ， 内 部 
的 文件 系统 实现 经 历 了 巨大 的 变化 。 这 与 第 2、3 章 中 处 理 器 设计 中 提 到 的 架构 与 实现 分 裂 有 
其 相似 性 。 

大 多 数 革 命 性 的 变化 是 为 了 适应 多 文件 系统 分 区 、 更 长 文件 名 、 更 大 文件 以 及 隐藏 本 地 
媒介 上 的 文件 与 网 络 上 的 文件 的 区 别 等 而 设计 的 。 

一 个 重要 的 UNIX 文件 系统 改变 引入 了 虚拟 文件 系统 (VEFS)。 这 种 抽象 使 得 多 个 潜在 不 
同 的 文件 系统 可 以 “在 表层 下 ”共存 。 文 件 系统 可 以 驻 留 在 本 地 设备 上 ， 一 个 通过 网 络 访问 
的 外 部 设备 ， 或 者 驻 留 在 其 他 不 同类 型 的 媒介 上 。VFS 并 不 影响 用 户 。 你 打开 、 读 、 写 文件 ， 
与 你 在 传统 UNIX 文件 系统 上 所 做 的 一 样 。VFS 的 抽象 十 分 清楚 哪个 文件 系统 为 你 的 文件 负 
责 ， 通 过 间接 层 (VFS 抽象 层 中 存储 的 函数 指针 )， 将 你 的 调用 重 定 向 到 特定 的 可 以 服务 你 请 
求 的 文件 系统 上 。 

现在 我 们 来 快速 地 看 一 看 Linux 自身 文件 系统 实现 中 的 一 些 发 展 。 在 第 6 章 中 ， 我 们 提 
到 了 MINIX 如 何 作为 Linux 的 入 口 工作 。Linux 的 第 一 个 文件 系统 使 用 了 MINIX 文件 系统 。 
它 在 文件 名 的 长 度 和 文件 的 个 数 上 有 限制 。 因 此 ， 它 很 快 就 被 能 够 避免 这 些 限 制 的 ext (表示 
可 扩展 文件 系统 ) PICT. Sai, ext 在 性 能 上 有 些 不 够 高 效 ， 从 而 在 其 基础 上 出 现 ext2 (ext 
的 第 二 个 版 本 ) 这 种 目前 依旧 在 Linux 社区 中 广泛 使 用 的 文件 系统 。 

ext2 ext2 文件 系统 分 区 的 磁盘 布局 与 11.6 节 中 的 通常 描述 没有 显著 的 区 别 。ext2 的 一 
些 较 为 实用 的 内 容 是 : 

。 目 录 文 件 : 第 一 个 是 目录 文件 索引 节点 结构 的 内 容 。 一 个 目录 文件 由 整数 个 连续 的 磁 

盘 块 组 成 ， 使 得 在 一 个 IO 操作 内 可 完成 向 磁盘 写 目 录 文 件 。 目 录 中 的 每 一 项 有 一 个 文 
件 或 目录 名 。 由 于 名 称 可 以 任意 长 ， 所 以 每 一 项 的 大 小 是 可 变 的 。 图 11-19a 是 目录 项 
的 格式 。 









可 变 长 度 字段 


ilike file names long 





图 11-19 目录 文件 中 每 一 项 的 格式 
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每 一 项 由 以 下 项 目 组 成 : 
E 索引 节点 号 : 一 个 定 长 的 字段 ， 给 出 了 关联 项 的 索引 节点 号 。 
图 项 的 长 度 : 一 个 定 长 的 字段 ， 以 字 节 为 单位 表明 了 项 的 长 度 ( 即 该 项 在 磁盘 上 占据 
的 空间 大 小 ) 它 可 以 用 来 确定 下 一 项 在 目录 结构 中 的 起 始 位 置 。 
图 项 的 类 型 : 一 个 定 长 的 字段 ， 说 明 该 项 是 数据 文件 (f) 还 是 目录 文件 (d), 
图 名 称 的 长 度 : 一 个 定 长 的 字段 ， 表 明文 件 名 的 长 度 。 
图 名 称 : 一 个 边 可 变 长 的 字段 ， 以 ASCII 给 出 文件 名 。 
图 填充 : 一 个 可 选 的 可 变 长 的 字段 ， 有 时 用 于 将 一 项 的 长 度 变 成 2 HE. RIRS 
看 到 ， 这 种 填充 空间 可 能 会 在 文件 删除 时 被 创建 或 者 扩展 。 
图 11-19b 是 一 个 名 为 “i like my filenames long” 的 文件 的 示例 项 ， 其 中 已 经 填 人 了 一 
些 值 。 每 个 字段 的 大 小 〈 以 字 节 为 单位 ) 也 在 图 中 标 出 来 了 。 
目录 中 的 项 以 文件 创建 顺序 排列 。 例 如 ， 你 创建 了 文件 “datafile”、“another datafile” 
以 及 “my_subdirectory”， 前 两 个 是 数据 文件 ， 第 三 个 是 目录 文件 。 目 录 项 如 图 11-20a 所 示 。 
假设 你 删除 了 其 中 的 某 个 文件 ， 例 如 “another_datafile”。 此 时 ， 在 图 11-20b 中 你 就 会 发 现 有 
一 块 空间 空 出 来 了 了。 被 删除 文件 项 的 空间 成 为 前 一 项 的 填充 部 分 。 在 目录 中 创建 新 文件 项 时 
就 可 以 再 次 利用 这 块 空间 了 。 


datafile 项 another datafile 项 my_subdirectory 项 


a) 








图 11-20 目录 文件 中 多 个 项 的 布局 


。 数据 文件 : 第 二 个 有 趣 的 地 方 就 是 数据 文件 的 索引 节点 结构 。 按 照 之 前 的 说 法 ，ext2 
将 MINIX 有 最 大 文件 数目 的 限制 消除 了 。 数 据 文件 的 索引 节点 结构 就 反映 了 这 种 改 
进 。 这 里 使 用 11.2.7 节 中 的 混合 分 配方 案 。 数 据 文件 的 索引 节点 包含 了 下 列 字 段 : 

E 12 个 数据 块 地 址 : 数据 文件 的 前 12 个 数据 块 的 地 址 可 以 通过 索引 节点 直接 获得 。 
对 于 小 文件 而 言 ， 这 么 做 很 方便 。 文 件 系统 也 尝试 连续 地 分 配 这 12 个 数据 块 以 便 性 
能 可 以 更 加 好 。 

图 1 个 一 级 间接 指针 : 这 个 指针 指向 的 磁盘 块 可 以 用 作 存 放 数 据 块 指针 的 容 右 。 例 如 ， 
一 个 512 字 节 的 磁盘 块 ， 帮 一 个 数据 块 指针 大 小 为 4 字 方 ， 那 么 第 一 级 间接 索引 就 
可 以 把 文件 大 小 扩展 128 个 数据 块 。 

图 1 个 二 级 间接 指针 : 这 个 指针 指向 的 磁盘 块 也 是 一 个 存放 了 指针 的 容 需 ， 其 中 每 个 指 
针 指 向 包含 了 一 级 间接 指针 的 磁盘 块 。 接 着 前 面 的 例子 ， 二 级 间接 索引 可 以 将 文件 
大 小 再 扩展 128 x 128 ( 即 2”) 个 数据 块 。 

国 1 个 三 级 间接 指针 : 这 个 指针 在 二 级 间接 指针 的 基础 上 又 加 了 一 级 索引 ， 使 得 文件 还 
可 以 扩展 128 x 128 x 128 (EI 2”) 个 数据 块 。 

图 11-21 给 出 了 这 样 一 个 索引 节点 的 所 有 填 入 字段 的 信息 。 
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一 级 间接 






索引 节点 
权限 及 管理 信息 


= a 





三 级 间接 





图 11-21 Linux ext2 中 一 个 数据 文件 的 索引 节点 结构 


CHEJ ext 系统 中 文件 最 大 大 小 是 多 少 (以 字 节 为 单位 ) ? 假设 一 个 磁盘 块 为 1KB 且 磁 盘 块 指针 需要 
4 字 节 。 
答 : 
直接 数据 块 
直接 数据 块 的 个 数 = 索引 节点 中 直接 指针 的 个 数 =12 (11-1) 
通过 一 级 间接 指针 得 到 的 数据 块 个 数 
接 下 来 ， 通 过 索引 节点 中 一 级 间接 指针 计算 可 以 得 到 的 文件 的 可 用 数据 块 个 数 。 一 级 间接 指针 指向 
一 个 包含 了 数据 块 指针 的 一 级 间接 表 。 
通过 索引 节点 一 级 间接 指针 可 获得 的 数据 块 个 数 
= 一 级 间接 表 中 的 指针 数 
= 磁盘 块 中 的 指针 数 
= 磁盘 块 大 小 /指针 大 小 (11-2) 
=1KB/4B 
=256 
通过 二 级 间接 指针 得 到 的 数据 块 个 数 
下 面 ， 我 们 计算 通过 索引 节点 的 二 级 间接 指针 可 以 获得 的 数据 块 个 数 。 二 级 间接 指针 指向 一 个 包含 
了 指向 多 个 一 级 间接 指针 表 的 多 个 指针 。 
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通过 索引 节点 的 二 级 间接 指针 可 获得 的 一 级 间接 指针 个 数 
= 磁盘 块 中 的 指针 数 
= 磁盘 块 大 小 /指针 大 小 
=1KB / 4B ( 11-3 ) 
=256 
通过 这 些 一 级 间接 表 可 访问 到 的 数据 块 个 数 CMH (11-2)) 
=256 (11-4) 
HA (11-3), (11-4) 可 短 ， 
通过 索引 节点 的 二 级 间接 指针 可 以 获得 的 数据 块 个 数 
=256 X 256 (11-5) 
通过 三 级 间接 指针 得 到 的 数据 块 个 数 
通过 类 似 的 分 析 可 知 ， 通 过 索引 节点 的 三 级 间接 指针 能 够 获得 的 数据 块 个 数 
=256 X 256 X 256 (11-6) 
Hx (11-1), (11-2), (11-5). (11-6) WA, 
一 个 文件 能 够 获得 的 磁盘 块 总 数 
=]2+256+256 X 256+256 X 256 X 256 
=12+2°+2'°+2" 
数据 文件 最 大 大 小 (数据 块 大 小 =1KB) 
=(12+2°+2'°+2™)KB 
>16GB 

日 志文 件 系统 ”大 多 数 现 代 的 Linux 文件 系统 都 是 日 志文 件 系 统 。 通 和 常 ， 你 会 觉得 回 文 
件 写 和 人 就 是 写 入 文件 数据 块 。 逻 辑 上 ， 这 并 没 错 。 人 然而， 实际 中 ,会 有 各 种 问题 出 现 。 例 如 ， 
如 果 文 件 太 小 了 , 那么 就 会 既 有 空间 开销 ,( 更 重要 的 是 ) 还 会 有 将 这 些小 文件 写 到 磁盘 上 的 
时 间 开 销 。 当 然 ， 操 作 系 统 的 缓冲 区 会 把 文件 写 到 内 存 里 然后 过 一 会 儿 册 写 人 和 磁盘。 除了 这 
种 优化 外 ， 最 终 文件 还 是 被 写 人 磁盘 。 小 的 文件 不 仅 浪 费 磁 盘 空间 (由 于 内 部 碎片 问题 )， 也 
会 导致 时 间 开 销 ( 寻 道 时 间 、 旋 转 延 迟 以 及 元 数据 管理 )。 

另 一 个 烦恼 是 系统 崩溃 。 如 果 系 统 在 写 入 文件 的 过 程 中 崩溃 了 ， 那 么 文件 系统 就 会 停留 
在 一 个 不 一 致 的 状态 上 。 我 们 已 经 略微 提 及 过 这 个 问题 CL 11.7 市 )。 

为 了 解决 写 人 小 文件 效率 低下 以 及 从 系统 骨 溃 恢复 的 问题 ， 现 代 文 件 系统 使 用 了 日 志 
式 。 这 个 想法 简单 且 直 观 ， 就 好 比 记 录 一 个 个 人 的 日 志 或 日 记 一 样 。 一 个 人 的 日 记 是 以 时 间 
为 序 的 一 个 人 每 天 活动 中 重要 事件 的 记录 。 日 志 对 文件 系统 也 起 同样 的 作用 。 在 写 文件 时 ， 
文件 系统 不 是 写 文 件 和 创建 一 个 小 文件 ， 而 是 创建 包含 了 与 该 文件 写 相 关 的 信息 ( 即 对 索引 
节点 和 超级 节点 的 元 数据 修改 ， 以 及 对 文件 数据 块 的 修改 ) 一 个 日 志 记录 (类 似 于 一 个 数据 
库 记 录 )。 因 此 , 日 志 就 是 文件 系统 所 有 变化 的 一 个 以 时 间 为 序 的 记录 。 这 种 方式 的 好 处 是 日 
志 与 文件 系统 本 身分 离 ， 让 操作 系统 对 其 实现 进行 优化 来 最 好 地 满足 操作 系统 的 需求 。 例 如 ， 
日 志 可 能 是 用 一 个 线性 的 数据 结构 实现 的 。 这 个 线性 数据 结构 中 的 每 一 项 表示 了 一 个 特定 的 
文件 系统 操作 。 

例如 ,假设 你 按照 一 定 顺 序 修改 了 三 个 文件 (X,Y AZ) 中 的 某 些 数据 块 ， 这 些 数据 块 分 
散在 磁盘 的 各 个 位 置 。 与 这 些 修改 相关 的 日 志 项 如 图 11-22 所 示 。 注 意 每 条 日 志 记 录 的 大 小 
可 能 不 同 ， 这 取决 于 相应 写 操 作 一 次 修改 的 文件 中 的 数据 块 个 数 

日 志 数 据 结 构 由 多 个 日 志 段 组 成 。 每 个 日 志 段 有 有 限 的 大 小 (例如 ，1MB)。 当 一 个 日 志 


段 满 时 ， 文 件 系统 会 把 它 写 到 磁盘 上 一 个 连续 分 区 并 为 接 下 来 的 文件 系统 写 操作 开 出 一 个 新 
的 日 志 段 。 注 章 ， 文 件 X、Y、Z 并 不 反映 对 它们 所 做 的 改变 。 每 过 一 会 儿 ， 文件 系统 会 读 取 
日 志 段 (以 它们 生成 的 顺序 )， 将 文件 的 变化 提交 实际 的 文件 ， 并 将 日 志 项 应 用 到 对 应 文件 上 。 
一 且 提 交 了 变化 ,该 日 志 段 就 作废 了 。 如 果 文 件 开 在 它 的 变化 被 应 用 前 被 读 取 ， 那 么 文件 系 
统 可 以 足够 智能 在 读 取 前 将 日 志 段 的 变化 应 用 到 文件 。 





ic. 录 文 件 X 的 修改 记录 文件 Y 的 修改 记录 文件 Z 的 修改 
图 11-22 ”修改 文件 系统 的 日 志 项 


显然 ， 日 志 段 将 小 的 写 操作 (可 以 是 小 文件 也 可 以 是 大 文件 中 的 一 小 部 分 ) 合并 起 来 变 成 
日 志 上 较 粗 粒度 的 操作 ( 即 ， 向 磁盘 上 连续 部 分 进行 较 大 的 写 操作 ) 。 

日 志 系 统 克 服 了 小 的 写 操作 问题 。 作 为 一 个 额外 功能 ， 它 还 能 帮助 系统 更 好 地 应 对 毅 溃 
问题 。 作 为 一 种 最 后 手段 ( 见 11.7 节 )， 操 作 系 统 在 月 演 或 电源 故障 时 将 所 有 内 存 中 的 信息 写 
人 磁盘 。 重 启 时 ， 操 作 系 统 将 恢复 内 存 中 的 日 志 段 。 文 件 系统 将 识别 出 日 志 段 的 变化 (此 时 
磁盘 上 和 内 存 中 的 日 志 段 都 从 崩溃 中 恢复 了 ) 没有 被 成 功 提交 。 文 件 系统 将 简单 地 重新 应 用 
日 志 记 录 使 得 其 一 致 性 得 到 满足 。 

ext3 是 Linux 文件 系统 的 下 一 个 版 本 。 与 ext2 相 比 ，ext3 文件 系统 的 主要 扩展 是 支持 日 

,在 这 种 意义 上 ， 用 ext2 建立 的 文件 分 区 可 通过 ext3 文件 系统 访问 ， 因 为 两 者 的 数据 结构 
和 内 部 抽象 是 一 样 的 。 由 于 创建 一 个 所 有 文件 系统 操作 的 日 志 可 能 在 空间 和 时 间 上 有 较 高 的 
代价 ， 所 以 ext3 可 以 只 对 元 数据 的 变化 ( 即 索 引 节 点 、 超 级 块 等 ) 做 日 志 。 这 种 优化 在 系统 
骨 溃 时 可 以 提供 更 好 的 性 能 ， 但 是 无 法 在 前 溃 后 保证 数据 的 正确 性 。 

还 有 一 些 新 的 UNIX 文件 系统 。ReiserFS 是 Linux 系统 只 有 元 数据 日 志 的 另 一 个 文件 系 
统 。jFS 是 IBM 的 一 个 日 志文 件 系 统 ， 用 于 IBM 的 AIX (也 是 一 个 UNIX 版 本 的 操作 系统 ) 
和 Linux。xFS 是 一 个 主要 为 SGI Irix 操作 系统 设计 的 日 志文 件 系统 。zFS 是 一 个 高 端 企业 级 
系统 使 用 的 高 性 能 文件 系统 ， 其 主要 针对 Sun 的 Solaris 操作 系统 。 这 些 文件 系统 的 讨论 超出 
了 本 书 的 范围 。 


11.9.2 Microsoft Windows 


微软 的 文件 系统 有 一 段 非常 有 趣 的 历史 。 如 你 所 知 ，MS-DOS 一 开始 就 作为 面向 PC 的 操 
作 系 统 。 由 于 在 PC 发 展 的 早期 ， 磁 盘 的 容量 都 非常 小 (大约 为 20 ~ 40MB 的 级 别 )， 所 以 这 些 
计算 机 的 文件 系统 也 受到 了 限制 。 例 如 ，FAT-16 (11.2.4 节 中 讨论 的 分 配方 案 中 的 一 个 特别 的 
例子 ) 使 用 16 位 磁盘 地 址 ， 每 个 文件 分 区 有 2GB 的 大 小 限制 。FAT-32， 使 用 了 32 位 磁盘 地 址 ， 
将 文件 分 区 的 大 小 限制 扩展 到 了 2TB。 这 两 个 文件 在 微软 的 XP 和 Vista 系统 上 已 经 逐渐 被 淘汰 
了 。2010 年 前 后 ，NT 文件 系统 (也 称 NTFS， 在 微软 的 NT 操作 系统 中 首次 引入 )， 已 经 成 为 事 
实 上 的 标准 微软 文件 系统 。FAT-16 可 能 在 一 些 可 移动 媒介 (例如 ， 软 盘 ) 上 仍 在 使 用 。FAT-32 
也 有 用 途 。 尤其 是 为 了 兼容 较 旧 版 本 的 Windows (例如 ，Windows 95、Windows 98 )。 

NTFS 支持 大 多 数 我 们 在 UNIX 文件 系统 中 讨论 的 特性 。 它 使 用 了 64 位 磁盘 地 址 ， 因 此 
可 以 支持 非常 大 的 磁盘 分 区 。 卷 是 该 文件 系统 的 基础 单元 。 一 个 卷 可 能 占据 磁盘 上 的 一 部 分 、 
整个 磁盘 ， 甚 至 多 个 磁盘 。 


API 和 系统 特性 NFS 与 UNIX 之 间 的 一 个 基本 区 别 是 文件 的 视角 。 在 NTFS 中 ， 文 件 
是 由 一 些 具有 类 型 的 属性 组 成 的 对 条， 而 不 是 UNIX 中 的 字 节 流 。 这 种 文件 视角 在 用 户 层 面 
可 以 提供 一 些 较为 明显 的 灵活 性 。 每 个 具有 类 型 的 属性 是 一 个 单独 的 字 节 流 。 这 就 使 得 我 们 
可 以 在 不 影响 文件 其 他 部 分 的 情况 下 创建 、 读 、 写 、 删 除 某 个 属性 。 有 些 属 性 类 型 是 所 有 文 
件 都 有 的 〈 例 如 ， 名 称 、 创 建 时 间 、 访 问 控 制 等 )。 比 如 ， 你 可 以 使 一 个 图 像 文件 具有 多 个 属 
性 : 原始 图 像 、 缩 略图 等 。 一 个 文件 的 属性 还 可 以 任意 创建 或 者 删除 。 

NTFS 支持 长 文件 名 (最 长 为 255 个 字符 )， 通 过 Unicode 字符 还 可 以 用 非 英 语文 字 对 文 
件 进 行 命 名 。 它 与 UNIX 类 似 ， 也 是 一 个 层次 化 的 文件 系统 ， 尽 管 UNIX 中 的 层次 分 隔 符 
“ J” 在 NTFS 中 被 替换 成 了 “\”。 我 们 在 11.1 节 中 讨论 过 的 文件 别名 的 软 链接 和 硬 链接 ， 在 
最 近 也 被 加 入 NTFS 文件 系统 中 。 

NTFS 的 一 些 有 趣 特性 还 包括 : 当 文 件 分 别 进行 写 和 该 时， 实时 压缩 和 解压 缩 ; 一 个 可 选 
的 加 密 特性 ;以 及 通过 日 志 来 支持 小 文件 的 写 信 和 系统 崩溃 。 

实现 5 UNIX 的 索引 节点 表 ( 见 11.3.1 节 ) AW, NTFS 的 主要 数据 结构 是 主 文件 表 
( MFT)。 它 也 存储 在 磁盘 上 ， 并 包含 了 文件 系统 其 他 部 分 的 重要 元 数据 信息 。 一 个 文件 通过 
MFT 中 的 一 个 或 多 个 记录 表示 ， 这 取决 于 属性 的 个 数 以 及 文件 的 大 小 。 通 过 位 映射 来 表示 哪 
些 MFT 记录 是 空闲 的 。 表 示 一 个 文件 的 MFT 记录 集合 在 功能 上 与 UNIX 中 的 一 个 索引 市 点 
相似 ,但 是 ， 只 是 相似 而 已 。 一 个 文件 的 一 个 (或 多 个 ) 主 记录 包含 了 下 列 属性 : 

。 文件 各。 

。 Fit [A] AX 

。 安全 信息 (用 于 文件 的 访问 控制 )。 

。 包含 了 数据 的 数据 或 指 癌 磁盘 块 的 指针 。 

。 一 个 可 选 的 指向 其 他 MFT 记录 的 指针 ， 如 果 文 件 太 大 无 法 用 一 个 记录 表示 或 者 如 果 文 

件 拥有 多 个 属性 ， 所 有 这 些 都 无 法 放 人 一 个 MFT 记录 中 。 

每 个 NTFS 文件 有 一 个 唯一 的 ID， 叫 做 对 象 引 用 ， 是 64 位 。 这 个 ID 是 MFT 中 该 文件 
的 索引 号 ， 它 提供 了 与 UNIX 中 索引 节点 编号 类 似 的 功能 。 

存储 分 配方 案 尽 最 大 可 能 为 文件 的 数据 块 分 配 连续 的 磁盘 块 。 为 此 ， 磁 盘 分 配方 案 维护 
以 簇 为 单位 的 可 用 磁盘 块 ， 其 中 每 簇 表示 一 段 连续 的 磁盘 块 。 簇 的 大 小 由 磁盘 格式 化 时 的 一 
个 参数 进行 指定 。 当 然 ， 我 们 无 法 每 次 都 把 连续 的 磁盘 块 分 配给 所 有 的 数据 块 。 比 如 ， 考 虑 
一 个 拥有 13 个 数据 块 的 文件 。 假 设 簇 大 小 为 4 块 ， 空 闲 链 表 包 含 了 起 始 于 磁盘 块 地 址 为 64、 
256、260 和 408 HUE. TEXT OIF, MZA 3 段 不 连续 的 分 配 ， 如 图 11-23 Pra. 






文件 名 和 其 他 标 | menaa | Siti O| aas | S 
ane | a T es 





图 11-23 一 个 由 13 个 数据 块 构成 的 文件 的 MFT 记录 


注意 这 种 分 配方 案 可 能 导致 内 部 碎片 ， 因 为 在 徐 408 中 有 3 个 剩余 的 磁盘 块 未 被 使 用 。 

一 个 MFT 记录 通常 有 1 ~ 4KB 的 大 小 。 因 此 ， 如 果 文 件 太 小 ， 文 件 的 数据 就 会 包含 在 
MFT 记录 自身 内 ， 这 也 就 解决 了 写 小 文件 的 问题 。 而 且 ， 基 于 簇 的 磁盘 分 配 保证 了 较 好 的 线 
性 访问 性 能 。 
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小 结 


在 本 革 中 ,我们 学 习 了 可 能 是 系统 中 最 重要 的 一 个 部 分 ,文件 系统 。 本 章 包 括 如 下 内 容 : 

。 与 文件 关联 的 属性 。 

© 侯 盘 存储 管理 使 用 的 分 配 策略 和 相关 的 数据 结构 ，。 

。 文件 系统 管理 的 元 数据 。 

© 文件 系统 的 实现 细 市 。 

© 操作 系统 各 个 子 系统 之 间 的 交互 。 

。 磁盘 上 文件 的 布局 。 

。 文件 系统 的 数据 结构 及 其 有 效 的 管理 。 

© 系统 骨 演 的 处 理 。 

。 其 他 物理 媒介 上 的 文件 系统 。 

我 们 也 了 解 了 一 些 目前 (2010 年 前 后 ) 正在 使 用 的 现代 文件 系统 。 

文件 系统 在 研究 和 开发 方面 还 是 一 块 肥 沃 的 土地 。 在 文件 系统 中 ， 你 可 以 看 到 在 处 理 
器 架构 与 实现 的 类 比 。 在 文件 系统 API 的 大 部 分 内 容 都 在 各 个 版 本 的 操作 系统 UNIX, 
Microsoft 等 ) 间 保 持 不 变 的 情况 下 ， 文 件 系统 的 实现 却 在 不 断 地 发 展 ， 其 中 的 一 些 是 由 于 磁 
盘 技术 上 的 进步 ， 还 有 一 些 是 由 于 应 用 中 文件 类 型 的 变化 。 例 如 ， 现 在 我 们 经 和 常 处 理 很 多 多 
媒体 文件 (音频 、 图 形 、 照 片 、 视 频 等 )， 而 文件 系统 的 实现 就 需要 能 够 适应 这 些 多 种 的 文件 
类 型 。 

本 章 只 是 涉及 文件 系统 实现 中 的 一 些 表面 知识 。 我 们 希望 可 以 激发 你 的 兴趣 ， 并 继续 学 
习 操 作 系 统 方面 更 高 级 的 课程 。 


练习 题 
1. 一 个 文件 的 属性 数据 存储 在 哪里 ? 说 出 每 种 方案 的 优 劣 。 
2. 观察 下 列 UNIX 中 的 目录 项 : 
-Ywxrwxrwx 3 rama 0 Apr 27 21:01 foo 
当 执行 下 列 命令 后 : 


chmod u-w foo 
chmod g-w foo 


文件 “foo” 的 访问 权限 是 什么 ? 
.选择 所 有 正确 的 : 

链 式 分 配 具 有 : 

。 较 好 的 线性 访问 

。 较 好 的 随机 访问 

。 较 容易 扩展 文件 大 小 

。 较 差 的 磁盘 利用 率 

。 较 好 的 磁盘 利用 率 
.选择 所 有 正确 的 

对 磁盘 空间 进行 固定 连续 分 配 具有 : 
。 较 好 的 线性 访问 

。 较 好 的 随机 访问 


We 


上 


KHZ 


。 较 容易 扩展 文件 大 小 
。 较 差 的 磁盘 利用 率 
。 较 好 的 磁盘 利用 率 


5. 假设 : 
磁盘 柱 面 数  =6000 
盘面 数 =3 
每 个 磁 面 的 面 数 = 
每 个 磁道 的 扇 区 数 =400 
每 个 扇 区 的 字 节 数 =512 
磁盘 分 配 策略 = 连续 柱 面 


a. 一 个 1GB 大 小 的 文件 需要 分 配 多 少 个 柱 面 ? 
b. 这 种 分 配 导 致 的 内 部 碎片 有 多 大 ? 
6. FAT 分 配 策略 的 问题 是 什么 ? 
7. 比较 链接 分 配 策略 与 FAT 分 配 策略 。 
8. 索引 分 配 怎样 解决 了 FAT 和 链接 分 配 的 问题 ? 
9. 假设 在 磁盘 上 使 用 索引 分 配方 案 : 
。 人 磁盘 有 3 个 盘面 (每 个 盘面 有 2 个 面 ); 
。 每 个 面 有 4000 个 磁道 ; 
。 每 个 磁道 有 400 NK; 
。 每 个 而 区 有 512 FH; 
。 每 个 索引 节点 是 一 个 占据 了 一 个 扇 区 的 大 小 的 固定 数据 结构 ; 
。 一 个 数据 块 ( 即 分 配 单位 ) 由 连续 的 4 个 柱 面 组 成 ; 
。 磁盘 数据 块 指 针 由 一 个 8 字 节 的 数据 结构 表示 。 
a. 该 系统 上 的 一 个 文件 最 小 占据 多 少 空 间 ? 
b. 这 种 分 配方 案 下 ， 一 个 文件 的 最 大 大 小 是 多 少 ? 
10. 考虑 以 下 的 混合 分 配方 案 : 
。 索引 块 大 小 = 256 字 节 
。 数据 块 大 小 = 8KB 
。 人 磁盘 块 指 针 大 小 = 8 字 节 (无论 是 数据 块 还 是 索引 块 的 指针 ) 


。 一 个 索引 节点 包含 2 个 直接 块 指针 ，1 个 一 级 间接 指针 ，1 个 二 级 间接 指针 ， 


a. 该 文件 系统 的 一 个 文件 最 大 可 以 有 多 少 字 节 ? 
b. 存储 一 个 1GB 的 文件 需要 多 少数 据 块 ? 
c. 存储 一 个 1GB 的 文件 需要 多 少 索 引 块 ? 

11. 硬 链接 和 软 链接 的 区 别 是 什么 ? 

12. 考虑 下 列 命令 : 


touch fl /* 创建 文件 £1*/ 
ln -s fl f2 /* 符号 链接 * / 
ln -s f2 £3 

ln f1 £4 / * 硬 链 接 * / 

ln £4 £5 


a. 通过 这 些 命令 一 共 会 创建 多 少 个 索引 节点 ? 
b. 每 个 创建 的 索引 节点 的 引用 计数 是 多 少 ? 
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1 个 三 级 间接 指针 。 


13. 对 一 个 磁盘 块 大 小 为 8SKB 、 磁 盘 块 指针 大 小 为 4 字 节 的 ext2 文件 系统 ， 能 够 存储 的 最 大 文件 可 以 是 
多 少 ? 画 出 索引 节点 结构 的 草图 并 说 明达 到 最 大 文件 大 小 的 计算 过 程 〈 参 见 例 11-8 )。 
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参考 文献 注释 和 扩展 阅读 


在 系统 方面 ， 处 理 器 的 微 架 构 、 缓 存 存储 器 和 文件 系统 大 概 是 3 个 得 到 较 好 研究 的 话题 。 这 3 个 
话题 的 定位 也 许 是 最 能 够 理解 的 ， 因 为 它们 对 应 用 程序 的 性 能 具有 最 大 的 影响 。UNIX 由 贝尔 实验 室 
的 Ritchie 和 Thompson 发 明 ， 而 大 多 数 普及 UNIX 的 工作 ， 尤 其 是 在 学 术 界 ， 大 和 多数 工作 是 由 UC- 
Berkeley 的 研究 人 员 所 做 的 ， 特 别 是 Bill Joy, Sun Microsystems 的 联合 创始 人 。 读 者 可 以 阅读 由 
[McKusick, 1984] 发 表 的 开创 性 论文 ， 其 中 综述 了 Berkeley UNIX 文件 系统 的 很 多 设计 原理 。McKuick 
等 人 [McKusick, 1996] 对 Berkeley UNIX 文件 系统 的 设计 与 实现 进行 了 详细 的 描述 。 对 于 任何 希望 
编写 操作 系统 的 学 生 而 言 ， 这 是 一 份 宝贵 的 资料 。 由 Prabhakaran 等 人 [Prabhakaran, 2005] 发 表 的 论 
文 也 很 重要 ， 其 中 介绍 了 日 志文 件 系统 的 发 展 进程 ， 包 括 了 Linux ext3, ReiserFS 和 Microsoft NTFS 
等 。Linux， 作 为 一 个 开源 项 目 ， 在 不 断 地 进步 。 因 此 ， 学 习 Linux 的 最 好 来 源 就 是 大 量 的 在 线 资源 9。 
Love[Love，2003] 和 Bovot、Cesati[Bovet，2005] 的 关于 Linux 的 书 也 是 很 好 的 学 习 Linux 的 补充 资源 。 

读者 可 以 通过 阅读 [Russinovich, 2005] 来 了 解 Microsoft 文件 系统 的 一 些 细节 。 


© www.linux.org。 
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Computer Systems: An Integrated Approach to Architecture and Operating Systems 


多 线程 编程 与 多 处 理 费 





多 线程 是 一 项 让 程序 可 能 并 发 地 执行 多 任务 的 技术 。 从 计算 机 发 展 的 早期 开始 ， 开 拓 并 
行 性 就 是 计算 机 科学 家 的 一 个 追求 。 在 20 世纪 70 年 代 早 期 ，Concurrent (并 发 ) Pascal 和 
Ada 的 程序 语言 就 加 入 了 表达 程序 级 并 发 性 的 特性 。 人 们 一 直 是 并 行 地 思考 和 完成 各 种 事情 。 
比如 ， 你 在 读书 时 可 能 还 会 听 一 些 最 喜欢 的 背景 音乐 。 我 们 经 常会 在 与 某 人 讨论 某 个 重要 话 
题 的 同时 用 双手 干 一 些 其 他 事情 ， 比 如 修 汽车 或 者 把 洗 好 的 衣服 到 起 来 等 。 计 算 机 扩展 了 人 
类 计算 的 能 力 ， 我 们 自然 也 希望 计算 机 能 够 代 蔡 我 们 并 行 地 执行 各 种 我 们 希望 完成 的 任务 。 
顺序 编程 让 我 们 不 得 不 以 顺序 的 方式 来 表达 我 们 的 计算 需求 。 很 不 位 ， 由 于 我 们 并 行 地 思考 
却 只 能 写 顺 序 执行 的 程序 表达 我 们 的 想法 。 举 个 例子 ， 考 虑 一 个 视频 监控 的 应 用 。 我 们 和布 望 
计算 机 能 从 10 个 不 同 摄像 头 上 连续 地 收集 图 像 ， 单 独 地 分 析 每 个 图 像 来 找 出 任何 可 疑 行 为 ， 
并 在 发 生 情 况 时 进行 报警 。 在 这 种 描述 中 并 没有 什么 顺序 执行 的 部 分 。 然 而 情况 恰恰 相反 。 
如 果 我 们 想 用 C 语言 编写 一 个 计算 机 程序 来 执行 这 个 任务 ,我 们 最 终 会 用 顺序 的 方式 来 编写 
代码 。 

本 章 目 的 是 介绍 开发 多 线程 程序 的 概念 ， 操 作 系 统 为 了 实现 这 些 概 念 所 需 的 文 持 ， 以 及 
为 了 实现 操作 系统 机 制 所 需 的 架构 支持 。 对 学 生 们 而 言 ， 并 行 编程 及 其 相关 问题 都 是 非常 必 
要 的 内 容 ， 因 为 现在 的 单 芯 片 处 理 需 包含 了 多 个 处 理 器 核 。 因 此 ， 并 行 处 理 在 当前 的 计算 系 
统 中 已 经 非常 常见 了 ， 无 论 在 低 端 或 者 高 端的 机 器 上 。 我 们 在 本 章 中 要 传达 的 一 个 重点 是 多 
线程 所 需 的 线程 和 系统 支持 是 非常 简洁 明了 的 。 


12.1 为 什么 需要 多 线程 


多 线程 让 我 们 得 以 在 算法 中 表达 其 内 在 的 并 行 性 。 线 程 与 进程 非常 类 似 ， 两 者 都 代表 了 
一 个 活动 的 处 理 单元 。 在 本 章 的 后 面 ， 我 们 将 讨论 线程 和 进程 在 语义 上 的 区 别 。 这 里 ， 我 们 
只 需 了 解 一 个 用 户 级 别 的 进程 可 能 由 多 个 线程 组 成 。 

我 们 首先 了 解 一 下 多 线程 能 在 编程 级 帮助 我 们 什么 。 第 一 ， 它 允许 用 户 程序 用 模块 化 的 
方式 表达 其 中 的 并 行 行为 ， 这 就 像 过 程 抽象 能 帮助 我 们 用 模块 化 的 方式 组 成 顺序 执行 的 程序 
一 样 。 第 二 ， 它 帮助 程序 中 具有 Vo 操作 


的 程序 进行 重 释 计算 。 我 们 从 第 10 章 中 计算 a NE 

了 解 到 DMA 让 一 个 高 速 IO 设备 可 以 直 VO 请 求 

接 与 内 存 进行 通信 ， 而 无 需 处 理 器 的 干 IO 

预 。 图 12-1 是 一 个 周期 性 进行 VOSE a wy - hae 

的 程序 ， 但 是 并 不 马上 需要 IO 的 结果 。 pour 

将 LO 活动 表达 成 一 个 单独 的 线程 可 以 帮 a) 顺序 进程 b) 多 线程 进程 

助 我 们 在 通信 时 利用 这 些 时 间 进 行 计算 。 图 12-1 使 用 线程 ,在 IO 时 进行 重 释 计算 。b) 中 的 
然后 ， 我 们 看 一 看 多 线程 在 系统 级 能 计算 线程 可 以 继续 执行 与 IO 线程 执行 的 IO 


够 提供 哪些 帮助 。 现 在 ， 在 一 个 计算 机 活动 无 关 的 计算 
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甚至 一 个 必 片 里 有 多 个 处 理 器 已 经 非常 常见 了 。 这 是 多 线程 很 重要 的 另 一 个 原因 ， 因 为 任何 
在 用 户 级 并 发 的 表达 方式 可 以 帮助 利用 存在 于 计算 中 的 硬件 并 行 性 。 想 象 一 个 视频 监控 的 程 
序 知 要 做 的 事情 。 图 12-2 展示 了 与 一 个 单独 视频 流 相关 联 的 处 理 过 程 。 程 序 的 数字 化 部 件 不 
靳 地 将 视频 转换 成 一 些 列 的 像素 帧 。 跟 踪 部 件 分 析 每 一 帧 中 需要 标注 的 内 容 。 报 警部 件 基于 
跟 踩 来 采取 具体 行动 。 应 用 的 流水 线 与 处 理 器 的 流水 线 很 相似 ， 即 使 在 一 个 更 大 的 级 中 。 因 
此 ， 如 果 我 们 在 计算 机 内 部 有 多 个 可 以 自动 工作 的 处 理 器 ， 它 们 就 可 以 并 行 地 执行 这 些 程序 
部 件 ， 从 而 提升 应 用 程序 的 性 能 。 

所 以 ， 从 程序 的 模块 性 、 更 好 地 利用 1/O 与 计算 的 重 倒 ， 以 及 并 行 处 理 所 带 来 的 性 能 提 
升 的 角度 来 看 ， 多 线程 是 非常 吸引 人 的 。 

本 章 中 ,我们 将 以 图 12-2 的 应 用 程序 为 例 ， 通 过 其 运行 的 例子 来 建立 多 线程 的 编程 概念 。 


线程 线程 线程 






报警 部 件 


图 12-2 ”视频 处 理 流水 线 。 一 个 持续 运行 的 应 用 程序 ， 摄 像 头 不 断 地 捕捉 一 帧 帧 的 图 像 
并 通过 数字 化 部 件 将 其 数字 化 ， 由 跟踪 部 件 分 析 ， 并 由 报警 模块 触发 控制 动作 





12.2 ”线程 所 需 的 编程 支持 


既然 我 们 已 经 知道 了 线程 可 以 作为 表达 并 发 性 的 工具 ， 那 么 线程 需要 些 什 么 来 支持 其 作 
为 一 种 编程 抽象 呢 ? 我 们 布 望 能 够 动态 地 创建 线程 ， 终 止 线程 ， 与 其 他 线程 进行 通信 ， 并 在 
线程 活动 之 间 进 行 同步 。 

就 像 系统 提供 了 一 个 包含 程序 员 需 要 的 篆 用 图 数 的 数学 库 ， 系 统 也 提供 了 函数 库 来 支持 
线程 抽象 。 我 们 在 接 下 来 的 几 个 小 市 中 介绍 能 够 提供 这 样 一 个 库 的 技能 。 需 要 注意 的 是 ， 数 
据 类 型 和 库 函 数 使 用 的 语法 仅 用 于 说 明 ， 真 正 的 语法 和 支持 的 数据 类 型 在 线程 库 的 不 同 实 现 
中 会 有 所 不 同 。 


12.2.1 线程 创建 和 终止 


一 个 线程 执行 一 段 程序 。 考 虑 程序 和 进程 之 间 的 关系 。 一 个 进程 在 程序 入 口 处 开始 执行 
一 个 程序 , 在 C 语言 程序 中 就 是 main 过 程 。 相 比 之 下 ， 我 们 可 能 希望 用 线程 表达 并 发 ， 可 以 
是 动态 地 在 程序 的 任何 点 。 也 就 是 说 ,线程 的 入 口 处 可 以 是 任何 用 户 定义 的 过 程 。 我 们 把 顶 
层 过 程 定义 为 一 个 (以 程序 设计 语言 的 可 见 性 规则 而 言 ) 可 见 的 过 程 名 称 ， 无 论 该 过 程 究竟 在 
哪里 被 用 作 一 个 线程 创建 的 对 象 。 顶 层 过 程 可 以 有 一 些 输 入 参数 。 

因此 , 一 个 典型 的 线程 创建 调用 可 能 是 如 下 所 示 : 

thread create( 顶层 过 程 ， 参 数列 表 ); 

线程 创建 调用 给 出 了 顶层 过 程 的 名 称 以 及 传递 的 参数 列表 ， 使 线程 从 那个 过 程 开 始 执行 。 
从 用 户 程 序 的 角度 来 看 ， 这 个 调用 会 创建 一 个 执行 单元 〈 即 ， 线 程 )， 而 它 与 发 出 这 个 调用 的 
当前 线程 是 并 发 的 (图 12-3 中 的 前 /后 图 片 )。 
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ite, thread create 了 水 数 实 例 化 一 个 新 的 称 为 线程 的 有 其 自己 生命 周期 的 独立 实体 。 

这 与 父母 生 下 孩子 类 似 。 一 旦 孩子 出 生 ， 学 会 走路 ， 他 就 会 不 再 依赖 父母 ， 开 始 在 家 的 
周围 漫步 做 着 各 种 自己 的 事情 (当然 需要 在 其 父母 的 限制 之 内 )。 这 就 是 实际 上 发 生 在 线程 上 
的 事情 。 一 个 执行 的 程序 是 一 个 进程 。 在 顺序 程序 中 只 有 一 个 拥有 控制 权 的 线程 ， 即 进程 。 
所 请 拥有 控制 权 的 线程 ， 指 的 是 一 个 活动 的 实体 ， 在 程序 的 内 存 印 记 上 漫游 ， 执 行程 序 员 的 
意图 。 既 然 一 个 线程 有 其 目 己 的 生命 周期 ， 那么 它 就 可 以 做 它 自己 的 事情 (当然 也 是 在 其 父 
进程 的 限制 之 内 )。 例 如 ， 在 图 12-3 中 ,一旦 创建 成 功 ,“ 子 线程 ”就 可 以 在 其 代码 内 进行 过 
程 调用 ， 而 不 管 “ 主 线程 ”在 它 的 代码 体内 正在 干什么 。 


主线 程 主线 程 子 线程 
thread dreate(child, args) thread dreate(child, args) 
a) 线程 创建 前 b) 线程 创建 后 
图 12-3 ”线程 创建 


我 们 来 看 一 看 对 子 线程 的 限制 。 还 是 以 人 类 为 例 ， 父 母 会 在 徘 近 楼 梯 的 地 方 放 一 扇 门 来 
防止 孩子 爬 楼 梯 ， 安 装 对 儿童 安全 的 橱柜 等 。 对 于 线程 ， 也 有 类 似 的 由 程序 设计 语言 和 操作 
系统 规定 的 限制 。 一 个 线程 在 顶层 过 程 中 开始 执行 。 换 句 话 说 ， 一 个 多 线程 程序 的 入口 也 是 
一 个 普通 的 顺序 程序 。 因 此 ， 程 序 设计 语言 的 可 见 性 和 作用 域 规则 对 一 个 线程 能 够 在 生命 周 
期 中 操作 的 数据 结构 也 有 同样 的 约束 。 当 操作 系统 将 程序 实例 化 进程 时 ， 它 会 给 每 个 程序 创 
建 一 个 唯一 的 内 存 空间 ， 即 地 址 空间 。 如 我 们 在 之 前 章节 里 看 到 的 ， 地 址 空间 包含 了 每 个 程 
序 特 定 的 代码 、 全 局 数据 、 栈 和 堆 等 部 分 。 进 程 在 这 个 “ 沙 盒 ”里 运行 。 该 进程 的 子 进 程 或 
子 线程 也 只 能 在 同样 的 沙 盒 里 运行 。 

读者 可 能 会 疑惑 ， 进 程 和 线程 之 间 有 什么 区 别 。 我 们 会 在 12.7 节 关 于 操作 系统 对 线程 的 
支持 部 分 详细 阐述 两 者 的 区 别 。 这 里 ,我 们 只 要 知道 与 进程 有 关 的 状态 数 远 远大 于 与 线程 相 
关 的 就 可 以 了 。 另 一 方面 ， 线 程 共享 父 进程 的 地 址 空间 ， 但 是 总 体 上 比 一 个 进程 相关 联 的 状 
态 信息 少 。 这 让 一 个 进程 比 一 个 线程 更 加 显得 重要 。 然 而 ， 进 程 和 线程 都 是 在 父 进 程 的 地 址 
空间 内 拥有 独立 控制 权 的 线程 ， 而 且 有 甚 自己 的 生命 周期 。 

进程 和 线程 的 一 个 基本 区 别 是 内 存 的 保护 。 操 作 系 统 把 每 个 程序 变 成 一 个 进程 ， 每 个 进 
程 都 有 其 自身 的 地 址 空间 作为 相互 之 间 的 墙 。 但 是 ， 线 程 在 一 个 单独 的 地 址 空间 内 执行 。 因 
此 ， 它 们 相互 之 间 并 无 保护 。 用 人 类 的 例子 来 说 就 ， 就 是 我 们 不 会 走 人 邻居 的 房子 里 ， 然 后 
在 墙 上 乱 涂 乱 画 。 然 而 ， 孩 子 ( 如 果 没 有 好 好 看 管 ) 会 很 高 兴 在 自己 家 里 的 墙 上 用 蜡笔 进行 涂 
有 鸦 。 他 们 也 许 会 相互 打架 。 我 们 马上 将 看 到 如 何在 线程 之 间 加 入 纪律 性 来 保证 它们 在 同一 个 
地 址 空间 内 保持 纪律 地 执行 。 

一 个 线程 自动 地 在 其 退出 开始 进入 的 顶层 过 程 后 终止 。 另 外 ， 库 可 能 还 会 提供 一 种 显 式 
的 调用 来 结束 同一 进程 的 线程 : 

thread terminate (tid); 


这 里 ，tid 是 系统 提供 的 希望 结束 线程 的 标识 外 
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CRM 写 出 图 12-2 所 示 程 序 中 初始 化 数字 化 部 件 和 跟踪 部 件 的 代码 段 。 
等 ， 


A 
见 图 12-4a. 


digitizer() 

{ 
/* code for grabbing images from camera 
* and share the images with the tracker 
*/ 

} 


tracker ( ) 

{ 
/* code for getting images produced by the digitizer 
* and analyzing an image 
*/ 

} 


main() 
{ 
/* thread ids */ 
thread_type digitizer tid, tracker tid; 


/* create digitizer thread */ 


digitizer tid = thread _create(digitizer, NULL); 


/* create tracker thread */ 





tracker tid = thread _create(tracker, NULL); 


/* rest of the code of main including 
* termination conditions of the program 
*/ 





图 12-4 a) 创建 线程 的 代码 段 
注意 阴影 部 分 就 是 创建 所 需 结 构 的 代码 。 


12.2.2 ”线程 之 间 的 通信 


线程 可 能 需要 共享 数据 。 例 如 ， 图 12-2 中 的 数字 化 部 件 与 跟踪 部 件 需 要 共享 其 创建 的 帧 
缓冲 区 。 

我 们 来 看 一 看 系统 如 何 实现 这 种 共享 。 恰 好 这 并 不 麻烦 。 我 们 已 经 注意 到 ， 一 个 多 线程 
程序 是 通过 将 一 个 顺序 程序 中 的 顶层 过 程 转化 成 线程 来 实现 的 。 因 此 ， 在 原始 程序 作用 域内 
的 多 个 线程 ( 即 顶 层 过 程 ) 都 可 见 的 数据 结构 就 成 为 线程 之 间 可 以 共享 的 数据 结构 。 具 体 地 ， 
在 一 个 像 C 这 样 的 程序 设计 语言 中 ， 全 局 数据 结构 就 是 线程 之 间 可 以 共享 的 数据 结构 。 

当然 ， 如 果 计 算 机 是 多 处 理 器 的 ， 在 实现 共享 时 就 会 (在 操作 系统 和 硬件 级 ) 存在 一 些 需 
要 处 理 的 系统 问题 。 我 们 会 在 12.9 市 再 来 看 这 些 问题 。 


ives 给 出 图 12-2 中 数字 化 部 件 和 跟踪 部 件 的 数据 结构 定义 ， 以 便 实现 图 像 共 享 。 


= 


图 12-4b。 
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sos 
#define MAX 100 /* maximum number of images */ 
image_type frame _buf[MAX]; /* data structure for 
* sharing images between 
* digitizer and tracker 
*/ 
digitizer () 
{ 
loop { 
/* code for putting images into frame_buf */ 
} 
tracker () 
{ 
loop { 
/* code for getting images from frame buf 
* and analyzing them 
图 12-4 b) 在 数字 化 部 件 和 跟踪 部 件 之 间 共 享 的 数据 结构 
注意 : (图 12-4b 的 ) 阴影 部 分 是 全 局 创建 的 数据 结构 ， 在 数字 化 部 件 和 跟踪 部 件 之 间 进 行 共享 527 


12.2.3 读 / 写 冲突 、 竞 争 条 件 及 不 确定 性 


在 一 个 顺序 执行 的 程序 中 ， 我 们 从 来 不 担心 数据 结构 的 完整 性 ， 因 为 程序 中 没有 并 发 的 
活动 。 然 而 ， 当 多 个 线程 在 一 个 地 址 空间 里 并 发 执行 时 ,线程 之 间 没 有 错误 地 相互 影响 就 很 
有 必要 。 我 们 定义 如 下 的 情况 为 读 写 冲 突 : 多 个 并 发 的 线程 同时 尝试 访问 一 个 共享 的 变量 ， 
且 至 少 有 一 个 线程 尝试 写 该 变量 。 而 竞争 条 件 发 生 在 当 一 个 程序 存在 读 / SHR, ALKA 
消除 这 种 冲突 的 同步 操作 时 。 程 序 的 竞争 条 件 可 能 是 有 意 的 或 者 无 意 的 。 比 如 ， 如 采 一 个 共 
享 变量 用 于 进程 间 的 同步 ， 那 么 就 是 一 个 有 意 的 竞争 条 件 。 


考虑 下 面 的 代码 段 : 

情景 #1: 

int flag = 0; /* shared variable initialized to zero */ 
线程 1; 线程 2: 

while (flag == 0) { À 


/* do nothing */ 
} x 
if (flag == 0) flag = 1; 


线程 1 和 线程 2 都 是 同一 个 进程 的 一 部 分 。 由 于 各 自 的 定义 ， 线 程 1 和 线程 2 存在 读 写 
冲突 。 在 一 次 循环 里 线程 1 不 断 地 读 取 共享 变量 flag， 而 线程 2 在 其 执行 过 程 中 写 该 变量 。 
表面 上 ， 这 种 设置 可 能 会 出 现 问 题 ， 因 为 两 个 线程 之 间 存在 竞争 。 然 而 ,这 是 一 个 有 意 苋 争 
(有 时 也 称 作 同步 竞争 )， 线 程 1 SE flag 的 值 被 线程 2 改写。 因此， 竞争 条 件 并 总 是 意味 者 
代码 有 问题 。 
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接 下 来 我 们 将 定义 会 导致 错误 程序 行为 的 特殊 苑 争 条 件 。 数 据 竞 争 是 指 没 有 同步 操作 
进行 协调 的 读 写 冲突 ， 即 线程 中 被 访问 的 变量 不 是 同步 变量 。 也 就 是 说 ， 数 据 竞 争 发 生 在 并 
行程 序 中 对 任意 访问 变量 进行 非 同步 访问 的 时 候 。 

考虑 下 列 代码 段 : 

情景 #1: 

int count = 0; /* shared variable initialized to zero */ 


线程 1(T1) 线程 3 (T2 线程 3(T3 


count = count+l; count = count+l; count = count+l; 


线程 4 (T4) 


printf("count = %d\n", count); 


在 这 4 个 线程 之 间 就 存在 数据 冲突 (针对 变量 count)。 线 程 4 会 输出 什么 值 ? 线程 1、2、 
3 都 对 当前 的 count 值 加 1。 然 而， 每 个 线程 看 到 的 当前 count 值 是 多 少 呢 ? 根据 递增 语句 的 
执行 顺序 (count=count+1 )， 线 程 4 的 printf 语句 将 输出 不 同 的 结果 。 

图 12-5 展示 了 4 种 不 同 的 执行 顺序 来 说 明 这 个 问题 。 


SS eS are 
T T3 T T2 
a) 


==— ed = 
T1 T3 T2 T4 
b) 


人 
T1 T4 T2 T3 
c) 


网 
T3 T1T4 T2 
d) 
图 12-5 在 一 个 单 处 理 器 上 使 用 非 抢 占 式 线程 调度 的 情况 下 ,情景 机 可 能 的 执行 情况 示 
例 。 线 程 执 行 顺序 的 不 可 确定 性 会 导致 T4 产生 输出 的 不 确定 性 


读者 可 能 会 想到 的 第 一 个 问题 是 : 为 什么 有 这 么 多 情景 2 中 所 示 代 码 的 可 能 执行 方式 ? 
答案 很 简单 。 线 程 是 并 发 的 ， 与 其 他 线程 异步 地 执行 。 因 此 ， 一旦 创建 了 这 些 线程 ， 它 们 的 
执行 顺序 就 由 计算 机 中 处 理 器 的 个 数 、 线 程 之 间 的 依赖 关系 以 及 操作 系统 使 用 的 调度 算法 决 
定 的 。 

图 12-5 所 示 的 情景 起 的 执行 时 间 轴 假设 使 用 单 处 理 器 来 调度 线程 ， 且 线程 之 间 无 依赖 
关系 。 也 就 是 说 ， 线 程 一 旦 创建 了 ， 线 程 就 可 能 以 任何 顺序 执行 。 而 且 ， 我 们 还 假设 调度 是 
非 抢 占 式 的 。 下 列 的 例子 说 明了 这 些 线程 的 执行 情况 可 能 超过 4 种 。 
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假设 一 个 进程 有 4 个 线程 ， 且 线程 在 一 个 单 处 理 器 上 调度 。 一 旦 创建 了 线程 ， 每 个 线程 就 全 
输出 其 线程 id， 然后 退出 。 假 设 使 用 非 抢占 式 调度 器 ， 那 么 有 多 少 种 可 能 的 执行 结果 ? 
F: 


如 题 可 知 ， 线 程 之 间 是 相互 独立 的 。 因 此 ， 操 作 系 统 可 能 以 任何 顺序 调度 它们 。 
4 个 线程 的 可 能 执行 个 数 = 41!。 


所 以 ， 并 行程 序 的 执行 与 在 单 处 理 硕 上 一 个 程序 的 顺序 执行 有 根本 的 不 同 。 顺 序 程序 的 
执行 模型 很 简单 : 所 有 指令 按照 程序 顺序 依次 执行 9。 我 们 定义 程序 顺序 为 对 程序 员 来 说 程序 
指令 的 文本 顺序 与 程序 每 次 执行 时 指令 的 逻辑 顺序 的 结合 。 逻 辑 顺序 显然 依赖 于 程序 员 期 望 
程序 去 完成 的 语义 。 比 如 ， 如 果 你 编写 一 个 高 级 语言 程序 ， 源 代码 就 提供 你 一 个 程序 的 文本 
顺序 。 根 据 输入 数据 和 程序 的 实际 逻辑 ( 即 条 件 语 句 、 和 循环、 过程 调用 等 )， 程 序 的 执行 会 按 
照 源 代码 中 的 某 条 路 径 执 行 。 换 名 话说 ， 顺 序 程序 的 行为 是 确定 性 的 ， 这 意味 着 对 于 给 定 的 
输入 ， 每 次 执行 程序 都 会 得 到 相同 的 输出 结果 。 

理解 由 多 个 线程 组 成 的 并 行程 序 的 执行 模型 是 很 有 帮助 的 。 一 个 进程 的 每 个 独立 的 线程 
经 历 与 顺序 程序 一 样 的 执行 过 程 。 然 而 ， 无 法 保证 同一 进程 的 不 同 线程 之 间 的 执行 顺序 。 即 
并 行程 序 的 行为 是 非 确定 性 的 。 我 们 定义 非 确 定性 执行 为 : 对 于 给 定 的 输入 ,一 次 执行 输出 
的 结果 可 能 与 另 一 次 有 所 不 同 。 

我 们 回 到 情景 42 来 看 一 看 图 12-5 中 的 这 4 个 可 能 的 非 抢占 式 程 序 的 执行 结果 。 每 种 情 
况 中 ，T4 可 能 输出 的 值 会 是 什么 呢 ? 

首先 来 看 图 12-5a。 线 程 T4 第 一 个 完成 执行 。 因 此 ， 它 输出 的 count 值 是 0。 在 图 12-5b 
中 ， 线 程 T4 最 后 执行 。 因 此 ，T4 输 出 的 值 是 3 (线程 T1、T2、T3 都 将 count 值 加 1)。 
图 12-5c 和 图 12-5d 分 别 输出 1 和 2。 

而 且 ， 如 果 调 度 器 是 抢占 式 的 ， 程 序 的 线程 之 间 会 有 更 多 可 能 的 交错 情况 。 糟 糕 的 是 ， 
语句 

count = count+l 

可 能 会 编译 为 一 串 机 器 指令 。 例 如 ， 这 条 语句 的 编译 会 产生 包含 了 从 内 存 加 载 、 累 加 、 
存储 到 内 存 的 一 系列 指令 。 线 程 也 许 会 在 完成 加 载 后 、 执 行 存 储 指令 前 被 抢占 。 这 对 期 望 的 
程序 行为 和 有 数据 竞争 的 实际 程序 执行 产生 严重 的 影响 。 

在 第 4 章 (4.3.4 节 ) 中 ,我 们 介绍 了 原子 操作 的 基本 概念 : 不 可 分 割 的 。 我 们 在 第 5 章 
中 看 到 ， 在 ISA 中 每 条 指令 的 执行 都 设计 成 原子 的 。 处 理 器 只 有 在 完成 一 条 指令 的 执行 后 才 
可 以 被 外 部 中 断 打 断 以 确保 每 条 单独 指令 的 原子 性 。 在 一 个 多 线程 程序 中 ， 指 令 的 原子 性 不 
足以 在 出 现 数据 竞争 时 保证 程序 行为 达到 预期 目的 。 我 们 将 在 12.2.6 节 回 顾 这 些 问 题 ， 并 论 
证 在 一 个 程序 例子 中 ， 一 组 指令 的 原子 性 也 是 需要 的 。 

图 12-6 说 明 由 于 并 行程 序 模型 中 的 非 确定 性 ， 同 一 程序 的 各 个 线程 的 指令 可 能 在 实际 运 
行 于 单 处 理 器 上 时 怎样 被 任意 地 交错 。 

图 12-6 有 几 点 需要 注意 。 同 一 线程 的 指令 按照 程序 顺序 执行 (如 Tl : 11, T2: 2, T3: 
I3，T4 : 4，… )。 然 而 ， 不 同 线程 的 指令 可 能 被 任意 地 交错 在 一 起 ( 见 图 12-6b)， 而 每 个 线 
程 内 部 却 是 按 顺 序 执行 的 。 例 如 ， 如 果 你 注意 线程 (T2) 的 指令 ， 就 会 发 现 它们 就 是 按照 


日 “注意 ,我们 在 第 5 章 ( 5.13.2 节 ) 中 提 到 ， 处 理 器 的 实现 可 能 会 选择 重新 安排 指令 的 执行 顺序 ;只 要 这 种 
重新 安排 的 顺序 对 程序 员 来 说 没有 影响 程序 结果 ， 那 么 就 不 会 有 问题 。 
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T2 的 程序 顺序 执行 的 。 
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a) 一 个 具有 3 个 线程 的 并 行程 序 b) 3 个 线程 指令 交错 执行 





图 12-6 ”一 个 并 行程 序 及 其 在 单 处 理 器 上 可 能 的 执行 顺序 。3 个 线程 之 间 指 令 的 交错 取决 
于 它们 在 单 处 理 需 上 怎样 调度 运行 


ives 给 定 下 列 线 程 以 及 它们 的 执行 历史 ， 内 存单 元 x 中 的 最 终 值 是 什么 ? 假设 每 条 指令 的 执行 是 
原子 的 ， 且 初始 时 Mem[x]=0. 


线程 1 (T1) 线程 2 (T2) 

Time 0: R1 <+ Mem[x] Time 1: R2 < Mem[x] 
Time 2: R1 < R1+2 Time 3: R2 < R2+1 
Time 4: Mem[x] < Rl Time 5: Mem[x] < R2 
答 ， 


线程 T1 和 T2 都 加 载 到 内 存单 元 ， 加 上 一 个 值 ， 并 将 其 写 回 。 由 于 数据 竞争 的 出 现 以 及 可 抢占 式 
调度 ， 不 幸 的 是 , x 的 值 将 是 最 后 一 个 存储 操作 后 写 入 的 值 。 
由 于 T2 最 后 执行 存储 操作 ， 所 以 x 的 最 终 值 就 是 1。 


总 之 ， 非 确定 性 是 并 行程 序 执行 模型 的 核心 。 对 于 应 用 程序 的 开发 者 来 说 ， 理 解 这 一 点 很 重 
要 ,需要 掌握 这 个 概念 来 编写 正确 的 并 行程 序 。 表 12-1 总 结 了 顺序 程序 和 并 行程 序 的 执行 模型 。 
表 12-1 顺序 程序 和 并 行程 序 的 执行 模型 
执行 模型 
顺序 程序 ”| 程序 执行 是 确定 性 的 ， 即 指令 按照 程序 顺序 执行 。 只 要 不 改变 程序 顺序 ， 处 理 器 的 硬件 实现 可 能 会 
为 了 流水 线 执行 的 效率 将 一 些 指令 的 顺序 打 乱 
并 行程 序 | 程序 执行 是 非 确定 性 的 ， 即 每 个 单独 线程 按照 程序 顺序 执行 。 然 而 ， 同 一 个 程序 中 的 不 同 线程 的 指 
令 可 能 是 交错 执行 的 
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12.24 线程 之 间 的 同步 


在 已 知 并 行程 序 的 执行 模型 是 不 确定 的 情况 下 ， 程 序 员 怎样 才能 让 他 的 程序 有 一 个 确定 
性 的 行为 呢 ? 答案 非常 简单 : 通过 线程 之 间 的 同步 即 可 获得 确定 性 的 行为 。 我 们 将 在 下 面 详 
细 讨 论 什 么 是 线程 之 间 的 同步 。 特 别 地 ， 我们 将 讨论 两 种 同步 方式 : 互 斥 与 会 合 。 

EHR 用 一 个 类 比 来 说 明 ， 我 们 在 图 12-7 中 看 到 一 些 孩 子 在 玩 页。 有 一 些 活 动 他 们 可 以 
在 不 妨碍 他 人 的 情况 下 单独 且 同 时 做 ( 见 图 12-7a)。 然 而 ， 如 果 他 们 共享 了 某 个 玩具 ， 我 们 
就 告诉 他 们 需要 轮流 玩 从 而 让 每 个 孩子 都 有 机 会 玩 (图 12-7b)。 





a) 孩子 们 单独 玩 b) 孩子 们 共享 一 个 玩具 9 
图 12-7 BATES “WR” BSc 


类 似 地 ， 如 果 有 两 个 线程 ， 一 个 是 生产 者 ， 一 个 是 消费 者 ， 当 消费 者 在 读 取 共 享 的 缓冲 
区 时 生产 者 不 修改 缓冲 区 就 很 必要 ( 见 图 12-8 )。 我 们 将 这 


种 要 求 称 作 互 斥 。 生 产 者 和 消费 者 同时 运行 ， 除 了 当 其 中 = ags 

的 一 个 或 者 两 者 都 要 修改 或 检查 共享 的 数据 结构 时 。 这 种 Pe 

情况 下 ， 为 了 保证 数据 的 完整 性 就 有 必要 让 它们 顺序 地 执 

行 。 ”图 12-8 线程 之 间 共 享 的 缓冲 区 。 
库 基 于 这 个 目的 提供 了 互 斥 锁 。 锁 是 具有 这 里 所 展示 ae cece ince eal 

语义 的 一 种 数据 抽象 。 程 序 可 以 像 任 意 其 他 类 型 定义 的 变 BKR WASIRA 

量 那样 定义 任意 数量 的 这 种 锁 。 读 者 可 以 看 到 与 现实 生活 de 


中 锁 的 相似 之 处 。 只 有 一 个 线程 可 以 在 一 个 时 间 持 有 一 个 
特定 的 锁 。 一 旦 线程 获取 了 一 个 锁 ， 其 他 线程 就 不 能 再 得 到 同一 个 锁 ， 直 到 获得 该 锁 的 线程 
将 其 释放 后 才 行 。 下 列 声明 创建 了 一 个 锁 类 型 的 变量 : 

mutex lock type mylock; 

下 列 调用 允许 一 个 线程 获得 / 释放 一 个 特定 的 锁 : 


thread mutex lock (mylock); 
thread_mutex_unlock( mylock) ; 


第 一 个 函数 成 功 返 回 则 说 明 调用 的 线程 成 功 地 获得 了 该 锁 。 如 果 男 一 个 线程 已 经 持 有 了 
这 个 锁 ， 那 么 调用 的 线程 就 会 阻塞 ， 直 到 锁 被 释放 且 处 于 空闲 状态 。 通 常 ， 我 们 把 一 个 线程 
的 阻塞 态 定义 为 某 个 线程 无 法 继续 执行 ， 直 到 某 个 条 件 满足 为 止 。 第 二 个 函数 释放 命名 的 锁 。 
有 时 ， 一 个 线程 可 能 不 希望 被 阻塞 ， 而 是 能 够 选择 在 锁 无 法 获得 时 干 些 其 他 事情 。 库 也 
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He HE FF — “PE BEL FE SA HR BE Da A : 


{success, failure} 全 thread _ mutex trylock (mylock); 
这 个 调用 会 对 于 获取 该 锁 的 请 求 返 回 成 功 或 者 失败 。 


eres 三 出 允许 图 12-8 中 生产 者 和 消费 者 线程 访问 缓冲 区 的 代码 段 ， 以 一 种 互 斥 锁 的 方式 ,分别 实 
现 放 入 /取出 一 个 物品 的 操作 。 
答 : 
item_type buffer; 
mutex lock type buflock; 
int producer!() int consumer () 
{ { 


item type item; item type item; 


/* code to produce item */ 


thread | mutex _lock (buf lock) ; ; 
buffer = item; | 


eae an doek ida 


thread matex unlock (outlook); 





ee ee ee ee ee ee 训 /* code to consume item */ 


} } 
注意 : 只 有 buffer 和 buflock 是 共享 的 数据 结构 “item ”是 每 个 线程 中 的 局 部 变量 。 


在 例 12-5 中 ,生产 者 和 消费 者 在 大 部 分 时 间 内 同时 执行 。 当 生产 者 或 消费 者 分 别 执行 阴 
影 部 分 的 代码 时 ,为 一 个 线程 干什么 呢 ?” 这 个 问题 的 答案 取决 于 男 一 个 线程 这 时 执行 到 哪里 。 
假设 生产 者 在 执行 阴影 部 分 代码 。 那 么 消费 者 的 行为 会 有 如 下 两 种 情况 : 
。 如果 在 阴影 部 分 之 外 ， 那 么 消费 者 也 在 执行 。 
。 如 有 果 消 费 者 试图 进入 阴影 部 分 ， 那么 它 不 得 不 等 待 直 到 生产 者 执行 完 阴影 部 分 ; 类 似 
地 ， 如 果 消 费 者 已 经 在 阴影 部 分 里 了 ， 那 么 生产 者 就 将 等 待 直到 消费 者 执行 完 阴 影 部 
分 为 止 。 
也 就 是 说 ， 生 产 者 和 消费 者 在 各 目的 阴影 部 分 里 的 执行 是 互 斥 的。 这 种 以 互 斥 方式 执行 的 代 
码 称 为 临界 区 。 我 们 将 临界 区 定义 为 一 段 程序 ， 在 其 内 部 线程 的 执行 是 序列 化 的 。 即 ， 一 个 时 间 
只 有 一 个 线程 能 够 执行 在 临界 区 内 部 的 代码 。 如 果 多 个 线程 同时 到 达 临 界 区 ， 那么 它们 之 一 可 以 
成 功 地 进入 并 执行 临界 区 中 的 代码 而 其 他 线程 只 能 在 人 口 处 等 待 。 我 们 中 的 很 多 人 都 在 一 个 忙碌 
的 ATM 机 上 经 历 过 类 似 的 情况 ， 就 是 当 我 们 不 得 不 等 到 轮 到 我 们 进行 提现 或 者 存款 时 。 
下面 我 们 展示 了 更 新 一 个 共享 的 计数 需 代 码 作 为 临界 区 的 例子 : 


mutex lock type lock; 
int counter; /* shared counter */ 


int increment_counter() 
{ 
/* critical section for 
* updating a shared counter 
*/ 
thread_mutex_lock(lock); 
counter = counter + 1; 
thread_mutex_unlock(lock) ; 
return 0; 
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任意 数量 的 线程 可 能 同时 调用 increment counter。 根 据 thread mutex lock AY HARE, A 
有 一 个 线程 可 以 在 临界 区 内 更 新 这 个 共享 的 计数 右 。 
给 出 下 图 中 线程 (由 箭头 定义 ) 的 执行 过 程 ， 指 出 哪些 处 于 活动 状态 ,哪些 处 于 阻塞 状态 ， 并 
给 出 理由 。 假 设 临 界 区 是 互 斥 的 ( 即 ， 它 们 由 同一 个 锁 管理 )。T1 ~ T4 是 同一 个 进程 的 线程 。 536 


T1 T2 T3 T4 


Tl 处 于 活动 状态 ， 并 在 临界 区 内 部 执行 ; 
T2 处 于 活动 状态 ， 并 在 临界 区 外 部 执行 
T3 处 于 活动 状态 ， 并 在 临界 区 外 部 执行 ; 
T4 处 于 阻塞 状态 ， 并 等 待 进 入 其 临界 区 。 (一旦 锁 被 Tl 杰 放 ， 它 就 会 进入 临界 区 。) 


给 出 下 图 中 线程 (由 箭头 定义 ) 的 执行 过 程 ， 指 出 哪些 处 于 活动 状态 ， 哪 些 处 于 阻塞 状态 ， 并 
给 出 理由 。 注 意 临 界 区 1 和 临界 区 2 是 由 不 同 的 锁 管 理 的 。 


T3 


cP 
T 处 于 阻塞 状态 ， 并 等 待 进 入 临界 区 2。( 一 旦 锁 被 T4 释放 ， 它 就 会 进入 临界 区 。) 537 
T3 处 于 活动 状态 ， 并 在 临界 区 1 外 部 执行 代码 。 
Tl 处 于 活动 状态 ， 并 在 临界 区 2 内 部 执行 代码 。 


会 合 ”为 了 更 好 地 理解 第 二 种 类 型 的 同步 方式 ， 我 们 用 另 一 种 类 比 来 说 明 。 你 和 你 上 
友 决 定 去 看 电影 。 你 先 到 了 电影 院 。 rd re i 
你 与 你 朋友 进行 了 动作 的 同步 ， 但 这 是 一 种 不 同 的 同步 方式 ， 我 们 称 为 会 合 

与 这 种 类 比 类 似 ， 一 个 线程 可 能 需要 等 待 同一 进程 中 的 男 一 个 线程 。 这 种 机 制 的 最 常见 
用 途 就 是 父 线 程 等 待 其 创建 的 子 线程 。 例 如 ， 主 线程 创建 了 一 个 子 线程 用 于 从 磁盘 读 取 文 件 ， 
与 此 同时 ， E ACEH RHI T MRH. ME gpa a i ptm 
执行 ， 直 到 创建 的 子 线程 也 完成 了 读 操作 。 一 个 很 好 的 主线 程 等 待 子 线程 终止 的 例子 ， 


T2 





E ae 


子 线程 终止 说 明文 件 读 文件 已 经 完 

库 通过 哺 数 调用 方式 提供 了 这 样 一 种 会 合 机 制 : 

thread join (Peer thread id); 

这 个 男 数 阻塞 调用 者 直到 相应 ID 的 线程 结束 。 那 个 线程 结束 后 ， 调 用 线程 才能 继续 执行 。 

更 形式 化 地 ,我们 把 会 合 定义 为 同一 程序 的 各 个 线程 之 间 的 集合 点 。 会 合 要 求 至 少 有 两 
个 线程 ， 不 过 可 以 包含 给 定 程序 的 所 有 线程 。 参 与 会 合 的 线程 都 到 达 会 合 点 后 就 可 继续 执行 。 
图 12-9 是 线程 之 间 会 合 的 一 个 例子 。 


TA 





图 12-9 线程 之 间 的 会 合 。 每 个 线程 可 能 在 不 同 的 时 间 到 达 会 合 点 ， 但 是 它们 会 一 直 等 
直到 所 有 需要 到 达 的 线程 都 到 达 会 合 点 才 继续 执行 


TI 第 一 个 到 达 会 合 点 ， 等 着 其 他 两 个 线程 到 达 。T3 接着 到 达 ; Ha, 472 到 达 后 ， 会 
合 完 毕 ，3 个 线程 分 别 继续 各 自 的 执行 。 显 然 ， 会 合 是 一 种 很 方便 的 让 并 行程 序 中 各 个 线程 
相互 之 间 进 行 协调 来 防止 不 确定 性 的 手段 。 会 合 机 制 的 一 种 最 常见 的 形式 是 障碍 同步 。 该 机 
制 在 科学 计算 的 并 行 应 用 程序 中 尤其 有 用 。 需 要 参与 会 合 的 给 定 程序 的 所 有 线程 执行 障碍 同 
步调 用 。 一 旦 所 有 线程 到 达 了 障碍 处 ， 各 个 线程 就 可 以 继续 各 自 的 执行 了 。 

thread jon 调用 是 通用 会 合 机 制 的 一 个 特例 。 它 是 一 种 单方 面 的 会 合 。 只 有 执行 了 这 个 
调用 的 线程 会 等 待 (假设 这 时 与 之 对 等 的 线程 还 未 结束 执行 )。 对 等 线程 完全 不 知道 男 一 个 线 
程 已 经 在 等 待 了 。 注 意 ， 这 个 调用 让 调用 线程 去 等 待 男 一 个 线程 的 结束 。 比 如 ， 如 果 主 线程 
创建 了 一 组 子 线程 ， 直 到 它们 都 执行 完毕 才 退 出 ， 那 么 它 需 要 执行 多 个 thread join 调用 ， 一 
个 接着 一 个 ， 每 个 调用 涉及 其 中 一 个 子 线程 。 在 12.2.8 节 ( 见 例 12-10 )， 我 们 将 看 到 两 个 线 
程 之 间 通 过 条 件 变 量 实现 的 对 称 的 会 合 方式 。 

还 有 一 种 现实 生活 中 的 例子 ， 但 在 线程 世界 却 不 是 那样 。 一 个 孩子 在 现实 生活 中 通常 活 
的 比 父 母 更 久 。 然 而 在 线程 的 环境 中 却 不 一 定 是 这 样 的 。 尤 其 是 ， 所 有 线程 在 同一 个 地 址 空 
间 里 执行 ， 其 结果 是 并 不 是 所 有 的 线程 都 有 同样 的 状态 。 在 父 线程 和 子 线程 之 间 就 有 区 别 。 
在 图 12-4a ( 见 例 12-1 ) 中 ， 当 进程 初始 化 后 ， 在 地 址 空间 里 就 只 有 一 个 称 为 “主线 程 ” 的 线 
程 。 一 旦 “主线 程 ” 创 建 了 “数字 化 线程 ”和 “跟踪 线程 ， 地 址 空间 里 就 有 3 个 活动 的 线程 。 
当 “ 主 线程 ”退出 后 会 发 生 什 么 ?” 它 是 父 线程 ， 因 此 与 进程 自身 是 同 义 的 。 根 据 大 多 数 操作 
系统 实现 的 常见 语义 ， 当 进程 中 的 父 线程 结束 后 ， 整 个 进程 也 就 结束 了 。 然 而 ， 注 意 如 果 一 
个 子 线程 又 创建 了 两 个 子 线程 ， 那 么 它 无 法 决定 这 两 个 子 线程 的 生命 周期 ; 而 是 由 与 进程 同 
义 的 主线 程 才 能 决定 。 这 是 thread join 调用 比较 方便 的 另 一 个 原因 ， 因 为 父 线程 可 以 在 退出 
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int foo(int n) 


© lie 2 so /和 


return 0; 





} 
int main() 
{ 
int £; 
thread type child tid; 
thread join(child tid); 
} 


注意 ;“ 主 线程 ”通过 执行 thread join 等 待 线 程 ID X child tid 的 子 线程 完成 后 才 退 出 程序 。 


12.25 ”线程 库 中 数据 类 型 的 内 部 表示 


我 们 注意 到 一 个 线程 在 希望 获取 一 个 已 经 被 其 他 线程 占有 的 锁 时 会 发 生 阻 塞 。 我 们 了 解 
这 样 的 陈述 是 什么 含义 。 现 在 我 们 已 经 清楚 ， 与 C 语言 这 样 的 程序 设计 语言 中 的 数据 类 型 
(例如 ,“int” 和 “float”) 相 比 ， 线 程 库 需 要 支持 本 半 中 介绍 的 那些 数据 类 型 。 

thread_type 和 mutex_lock_type 是 不 透明 数据 类 型 ， 意 味 着 用 户 无 法 直接 访问 这 些 数据 类 
型 的 内 部 表示 。 在 内 部 ， 线 程 库 可 能 包含 了 与 thread type 相关 的 一 些 信 息 。mnutex_lock type 
非常 有 意思 ， 也 值得 从 程序 员 的 角度 更 多 地 了 解 它 。 这 种 数据 类 型 变量 的 内 部 表示 至 少 有 以 
下 两 样 东 西 : 

。 当 前 持 有 锁 的 线程 (如果 有 的 话 )。 

。 等 待 锁 的 等 待 请求 队列 (如果 有 的 话 )。 

因此 ， 如 果 我 们 有 一 个 锁 变量 工 ， 当 前 ， 线 程 T1 拥有 该 锁 ， 还 有 两 个 线程 T2 和 T3 正在 
等 待 获取 该 锁 ， 那 么 变量 工 在 线程 库 中 的 内 部 表示 可 能 看 起 来 像 下 面 这 样 : 





当 T1 释放 锁 后 ，T2 获得 该 锁 ， 因 为 T2 是 等 待 队列 中 的 第 一 个 线程 。 注 意 ， 每 个 锁 变 量 
有 自己 的 等 待 队 列 。 一 个 线程 只 可 以 在 任何 时 刻 位 于 一 个 等 待 队 列 中 。 


假设 下 列 事 件 按 所 示 顺 序 发 生 (TI ~ T5 是 同一 个 进程 的 线程 ): 
T1 执行 thread mutex_ lock(L1); 
T2 执行 thread mutex lock(L1); 
T3 44.47 thread_mutex_lock(L2); 
T4 执行 thread_mutex_lock(L2); 
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T5 44.47 thread_mutex_lock(L1); 
假设 在 此 之 前 没有 其 他 对 线程 库 的 调用 ， 请 给 出 在 下 列 5 不 调用 之 后 两 个 锁 L1 和 12 的 内 部 队列 





12.2.6 ”简单 的 编程 示例 


无 同步 的 基本 代码 首先， 我 们 需要 了 解 为 什么 需要 同步 。 看 一 看 下 面 的 示例 程序 #1， 
其 包含 了 图 12-2 中 数字 化 部 件 和 跟踪 部 件 之 间 的 交互 。 这 里 ， 我 们 将 慢 慢 地 改进 这 个 程序 使 
其 达到 应 用 所 需 的 语义 。 为 了 方便 高 级 读者 ， 样 例 程序 #5 给 出 了 提供 所 需 语义 的 程序 ( 见 
12.2.9 47). 
ja 
* Sample program #1: 


*/ 
#define MAX 100 





digitizer() tracker ( ) 

{ { 
image type dig image; image type track_image; 
int tail = 0; int head = 0; 
loop { /* begin loop */ loop { /* begin loop */ 





grab(dig image); 





head = head + 1; 
tail = tail + 1; analyze(track_image) ; 
} } 
} /* end loop */ } /* end loop */ 
} } 


在 这 个 示例 程序 中 ，bufavail 和 frame_buf 是 两 个 线程 之 间 需 要 共享 的 数据 结构 。 示 例 程 
Fe frame buf 实现 为 一 个 循环 队列 ， 通 过 head Fil tail 指针 实现 在 尾部 插入 、 头 部 删除 ( 见 
图 12-10， 阴 影 区 域 包含 了 frame_buf 中 的 合法 项 目 )。 绥 冲 区 的 可 用 空间 由 bufavail 变量 表示 。 

head 和 tail 指针 是 自己 线程 内 部 的 局 部 变量 。 数 字 化 部 件 的 代码 不 断 地 循环 ， 从 摄像 头 
抓 取 一 个 图 像 ， 放 人 帧 缓冲 区 中 ,将 tail 指针 指向 frame buf 中 下 一 个 空 的 位 置 。 帧 缓冲 区 中 
空间 的 可 用 性 ( bufavail>0 ) 表明 执行 是 在 循环 内 部 。 类 似 地 ， 跟 踪 部 件 的 代码 不 断 地 循环 ， 
从 帧 缓冲 区 中 获取 一 个 图 像 (如 果 有 的 话 )， 将 head 指针 指 回 下 一 个 frame_buf 中 的 合法 帧 ， 
并 对 帧 进行 相关 分 析 。 除 了 阴影 部 分 之 外 两 个 线程 其 他 都 相互 独立 ( 见 示 程 序 #1 )。 阴 影 部 
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分 的 代码 对 共享 变量 frame buf 和 bufavail 进行 操作 。 


frame buf 


J 尾 
frame buf 中 的 frame buf 中 
第 1 个 有 效 帧 的 第 1 个 空 点 
图 12-10 ”通过 头 和 尾 指针 ， 像 循环 队列 一 样 执行 frame buf。 当 跟踪 部 还 未 处 理 时 ， 阴 
影 区 域 是 新 的 项 目 


一 组 指令 的 原子 性 需求 ”前 一 段 代码 的 问题 在 于 数字 化 部 件 和 跟踪 部 件 的 线程 同时 运行 ， 
当代 码 在 不 同 处 理 器 上 运行 时 ， 就 可 能 同时 对 共享 的 数据 结构 进行 读 和 写 。 图 12-11 给 出 了 
这 种 情形 ， 即 两 个 线程 同时 试图 修改 bufavail。 

我 们 将 更 深 地 来 看 一 看 这 种 情况 。 语 句 


bufavail = bufavail - 1; (1) 


在 处 理 需 上 作为 一 组 指令 执行 (将 bufavail NAF area; 执行 递减 操作 ; 把 寄 
存 需 的 内 容 人 存 回 bufavail) . 
类 似 地 ， 语 句 


bufavail = bufavail + 1; (2) 


在 处 理 器 上 也 作为 一 组 指令 执行 (将 bufavail 4A CDP S A ATS 执行 办 加 操作 ; 把 寄 
存 需 的 内 容 存 回 bufavail ) 。 


数字 化 ERER ae 
bufavail = bufavail — 3 Se = bufavail + 1; 


共享 的 数据 结构 
图 12-11 ， 非 同 步 访 问 共 享 数 据 产 生 的 问题 。 数字 化 部 件 和 跟踪 需 部 件 同 时 更 新 则 一 个 内 
存单 元 (bufavail) 


为 了 程序 的 正确 执行 ,我们 需要 让 指令 ( 1) 和 指令 (2) 两 条 语句 以 原子 的 形式 执行 。 
Bl, BARS (1) 先 执行， 指令 (2) 后 执行 ， 或 者 反 过 来 。 指 令 ( 1 ) 和 指令 (2 ) 相互 交 
错 执行 会 导致 程序 出 现 错误 和 意外 的 行为 。 这 是 我 们 在 12.2.3 节 提 到 的 数据 竞争 。 在 12.2.3 
节 中 我 们 提 到 ， 即 使 是 在 一 个 单 处 理 器 上 也 可 能 出 现 这 种 指令 交错 的 情形 ， 这 是 由 上 下 文 切 
换 引 起 的 ( 见 例 12-4 )。 人 处理 器 在 指令 集 架构 级 保证 了 每 条 指令 的 原子 性 。 系 统 软 件 ( 即 操作 
系统 ) 则 需要 保证 一 指令 的 原子 性 。 

因此 ， nent 我 们 需要 将 对 共享 数据 结构 的 访问 封装 到 临界 区 中 ， 这 就 保证 
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了 执行 的 互 斥 。 但 是 ,我们 一 定 要 小 心 谨 慎 地 选择 什么 时 候 以 及 怎样 来 使 用 同步 。 随 便 地 滥 
用 同步 在 保证 原子 性 的 同时 可 能 会 限制 并 发 性 ， 更 严重 地 ， 会 导致 程序 的 不 正确 行为 。 
使 用 粗 粒度 临界 区 的 代码 改进 ”我们 接 下 来 将 在 同一 个 程序 中 使 用 同步 结构 thread _ 
mutex lock 和 thread mutex unlock 来 实现 互 斥 的 目的 。 
示例 程序 #2 是 图 12-2 中 的 另 一 个 多 线程 样 例 程序 。 这 个 程序 说 明了 互 斥 锁 的 使 用 方法 。 
与 示例 程序 #1 的 区 别 是 ， 它 在 阴影 部 分 的 代码 加 入 了 同步 概念 。 在 每 个 数字 化 和 跟踪 器 部 件 
线程 的 内 部 ，lock 与 unlock 之 间 的 代码 就 是 每 个 线程 访问 共享 数据 结构 要 完成 的 工作 。 同 步 
概念 使 得 lock 和 unlock 之 间 的 整 段 代码 的 原子 性 得 到 了 保证 。 程 序 可 以 得 到 “正确 的 ”所 需 
语义 ,但 有 严重 的 性 能 问题 ， 我 们 接 下 来 将 详细 曾 述 。 
/* { 
* Sample program #2: 
sai MAX 100 


int bufavail = MAX; 
image type frame buf[MAX]; 





mutex_lock_type buflock; 


digitizer() tracker () 
{ 
image type dig image; image type track_image; 
int tail = 0; int head = 0; 


loop { /* begin loop */ loop { /* begin loop */ 








if (bufavail > 0) { if (bufavail < MAX) { 


grab(dig image); track_image = 

frame buf[tail mod MAX] = frame buf[head mod MAX]; 
dig image; head = head + 1; 

tail = tail + 1; bufavail = bufavail + 1; 

bufavail = bufavail - 1; analyze(track_image) ; 


} } 






} /* end loop */ } /* end loop */ 
} } 


使 用 细 粒 度 临 界 区 的 代码 改进 ”仔细 检查 示例 程序 42 就 会 发 现 它 没有 同步 问题 ， 但 是 数 
字 化 和 跟踪 器 线程 之 间 没 有 并 发 性 的 执行 部 分 。 我 们 分 析 在 该 样 例 程 序 中 需要 什么 样 的 互 奈 。 
对 于 数字 化 部 件 所 需 的 抓 取 图 像 以 及 跟踪 器 对 图 像 的 分 析 没 有 互 矿 的 必要 。 类 似 地 ,一旦 线 
程 通过 检查 bufavail 确定 了 对 frame buf 操作 的 合法 性 之 后 ,插入 或 者 删除 项 目 也 可 以 并 发 地 
进行 。 就 是 说 ， 即 使 frame_buf 是 一 个 共享 的 数据 结构 ， 在 程序 中 的 使 用 中 也 只 是 序列 化 的 访 
问 。 因 此 ， 我 们 将 程序 改 成 示例 程序 #3 所 示 的 样子 来 增加 两 个 线程 之 间 的 并 发 性 。 我 们 把 互 
斥 限制 为 对 bufavail 的 检查 和 修改 上 。 不 幸 的 是 ， 这 样 的 代码 还 是 有 严重 的 问题 ， 我 们 将 稍 
后 做 出 解释 。 


/* 
* Sample program #3: 
* / 
#define MAX 100 
int bufavail = MAX; 
image type frame_buf[MAX]; 
mutex lock type buflock; 
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digitizer() tracker () 

{ { 
image_type dig_image; image_type track_image; 
int tail = 0; int head = 0; 


loop { /* begin loop */ in { /* begin a? * / 
lai ic a rae ee 


be 





ee nash, mağa = 

frame _buf[tail mod MAX] = frame buf[head mod MAX]; 
dig image; head = head + 1; 

tail = tail + 1; Ge RA IRIS CE 





ee E 0 analyze(track image); 
} /* end loop */ }/* end loop */ 
} } 


12.2.7” 死 锁 和 活 锁 


我 们 来 详细 分 析 示 例 程 序 #3 的 问题 。 考 虑 数字 化 部 件 代 码 中 的 while 语句 。 它 通过 检查 
bufavail 来 寻找 frame buf 中 的 空闲 位 置 。 假 设 frame buf 是 满 的 。 此 时 ， 数 字 化 部 件 会 不 断 地 
执行 while 语句 ， 等 着 fame buf 有 新 的 空间 释放 出 来 。 跟 踪 需 需要 通过 移 除 frame_buf 中 的 一 
个 项 目 并 累加 bufavail。 然 而 ， 数 字 化 部 件 持 有 bufock， 因 此 跟踪 需 会 阻塞 在 获取 buflock 的 地 
方 。 类 似 地 ， 当 frame buf 为 空 时 也 会 有 这 种 情况 GREASY FAY while 语句 )。 

我 们 刚才 描述 的 问题 称 为 死 锁 ， 是 所 有 并 行程 序 都 不 想 面 对 的 糟糕 问题 。 死 锁 是 指 当 一 
个 线程 正在 等 待 一 个 永远 不 可 能 发 生 事件 时 的 情形 。 例 如 ， 数 字 化 部 件 在 while 循环 中 等 待 
bufavail 变 为 非 零 值 ， 但 这 个 事件 却 因为 跟 踊 器 无 法 获取 锁 而 不 会 发 生 。 之 前 描述 的 情形 是 
死 锁 的 一 种 特殊 情形 ， 通 常 称 为 活 锁 。 涉 及 死 锁 的 线程 可 以 主动 也 可 以 被 动 地 进行 等 待 。 
活 锁 发 生 在 当 一 个 线程 主动 检查 一 ee 在 这 个 例子 中 ， 我 们 看 到 ， 数 
字 化 线 部 件 有 buflock 并 期 待 bufavail 变 为 非 零 值 。 这 是 活 锁 ， 因 为 它 在 滔 费 处 理 需 的 资源 
区 等 待 一 个 不 会 发 生 的 事件 。 男 一 ti ie ee 
是 被 动 的 ， 因 为 它 直 到 锁 释 放 都 会 被 操作 系统 阻塞 。 无 论 等 待 是 主动 的 还 是 被 动 的 ， 涉 及 
死 锁 的 线程 就 永远 地 被 阻塞 了 。 读 者 应 该 很 明白 死 锁 和 活 锁 是 并 行程 序 执行 中 的 另 一 个 基 
本 的 非 确 定性 特点 。 

我 们 明白 前 面 代码 中 的 while 语句 并 不 需要 互 斥 ， 因 为 它们 只 是 检查 缓冲 区 的 可 用 性 。 事 
XE, Æ while 语句 的 互 斥 性 移 除 就 能 消灭 这 里 的 死 锁 问题 。 示 例 程 序 检 采用 了 这 个 方法 ， 
其 与 示例 程序 #3 的 区 别 就 是 while 语句 周围 关于 锁 的 部 分 在 两 个 线程 中 都 删除 了 。 

fe 

* Sample program #4: 


*/ 


#define MAX 100 


int bufavail = MAX; 
image type frame_buf[MAX]; 
mutex lock type buflock; 
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digitizer() tracker () 
+ 
image type dig image; image type track image; 
int tail = 0; int head = 0; 
loop {/* begin loop */ loop {/* begin loop */ 


grab(dig image); 


while (bufavail == MAX) 





do nothing; 





while (bufavail == ») 


‘do nothing; 

track image = 

frame buf[tail mod MAX] = frame buf[head mod MAX]; 
dig image; head = head + 1; 

tail = tail + 1; 

thread mutex lock(buflock); 

thread mutex lock(buflock); bufavail = bufavail + 1; 
bufavail = bufavail - 1; thre 





re Laaper unlock (bariock)s 





thread mutex _unlock(buflock) ; 


analyze(track_image); 
} /* end loop */ } /* end loop */ 
} } 


这 种 解决 方案 是 正确 的 ， 而 且 在 两 个 线程 之 间 具 有 并 发 性 。 然 而 ， 由 于 等 待 的 原因 这 种 
方案 的 效率 较 低 。 我 们 把 两 个 线程 中 的 while 等 待 称 作 忙 等 待 。 这 种 等 待 效率 低下 ， 因 为 处 
理 需 可 以 在 这 时 给 其 他 进程 或 线程 做 些 更 有 用 的 事情 。 


12.2.8 ”条 件 变量 


理想 情况 下 ， 我 们 和 希望 系统 能 够 识别 数字 化 线程 正在 等 待 的 条 件 (bufavail > 0 ) 没有 得 到 
满足 ， 因 此 将 其 持 有 的 锁 释放 ， 当 该 条 件 满足 后 再 重新 调度 它 。 

这 是 另 一 种 通常 由 库 提 供 的 数据 抽象 语义 ， 称 为 条 件 变量 。 

下 列 声明 创建 了 一 个 条 件 变 量 类 型 的 变量 : 

cond var type buf not empty; 

库 也 提供 了 让 线程 通过 条 件 变 量 等待 和 唤醒 另 一 个 线程 的 方式 : 


thread cond wait(buf not empty, buflock); 
thread cond signal(buf_not_empty); 


第 一 个 调用 让 线程 (我 们 例子 里 的 跟踪 器 ) 等 竺 一 个 条 件 变量 。 等 待 一 个 条 件 变量 相当 
于 把 调用 的 线程 从 调度 列表 中 删除 。 这 个 调用 中 的 第 二 个 参数 是 一 个 互 斥 锁 变 量 。 在 将 调 
用 线程 从 调度 列表 中 删除 之 前 ， 库 隐 含 地 先 执行 一 个 unlock 的 操作 。 第 二 个 调用 则 把 等 待 
该 条 件 变 量 的 线程 唤醒 。 唤 醒 ， 顾名思义 ， 意 味 着 等 待 的 线程 可 以 继续 执行 了 。 库 了 解 与 
等 待 调用 相关 联 的 锁 变 量 。 因 此 ， 库 会 在 调度 等 待 的 线程 前 先 在 该 变量 上 调用 一 个 lock 操 
作 。 当 然 ， 如 果 没 有 等 待 的 线程 ， 对 条 件 变量 的 唤醒 操作 就 会 被 当做 一 个 空 (NOP ) 操作 。 
如 果 有 多 个 线程 等 待 着 同一 个 条 件 变 量 ， 那么 库 会 选择 其 中 一 个 (通常 根据 先 来 先 服务 原 
则 ) 并 发 送 唤醒 信号 。 在 通过 等 竺 和 唤醒 方式 进行 线程 同步 时 要 非常 细心 。 图 12-2a 是 一 个 
正确 使 用 的 例子 。 而 图 12-2b 是 一 个 错误 使 用 的 例子 ，T1 在 T2 被 唤醒 后 开始 等 待 ， 导 致 了 
死 锁 。 

图 12-12b 说 明了 一 个 过 早 发 送 的 信号 会 导致 死 锁 的 情况 。 例 12-10 说 明 如 何 设计 一 种 会 
合 机 制 ， 让 两 个 线程 无 论 谁 先 到 达 都 能 进行 同步 。 
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T1 Te T1 T2 
$- cond_signal (c) 
cond_wait (c, m) cond_wait (c, m) 
阻塞 i 
继续 1 cond_signal (c) 
a) TENA AU SE I b) 在 唤醒 后 等 待 (Tl 永远 被 阻塞 ) 


图 12-12 ”使 用 条 件 变 量 的 等 待 和 唤醒 :“c” 是 条 件 变量 ,“m” 是 cond wait 调用 中 与 
“c” 相 关联 的 互 斥 锁 。 在 a 中 ，TI1 收 到 了 唤醒 信号 ， 因 为 它 已 经 在 等 待 了 ; 
而 b 中 ,信号 丢失 了 ， 因 为 Tl 此 时 并 未 在 等 待 


写 出 wait for buddy) 的 代码 ， 使 得 恰好 2 个 线程 能 够 相互 会 合 。 两 个 线程 谁 先 到 达 都 可 
以 。 注 意 这 是 一 种 通用 的 完成 同一 进程 的 独立 线程 之 间 会 合 的 方式 。 


wait_for_buddy() 


wait_for_buddy() SH 
阻塞 继续 
继续 
答 : 
解决 方案 使 用 了 一 个 布尔 变量 (buddy waiting), -ERM (mtx) 和 一 个 条 件 变量 (cond)。 基 本 
思想 如 下 : 


。 无 论 哪 个 线程 先 到 达 (下 述 代 码 的 “证 ”部 分 )， 将 buddy_waiting 标识 设 为 true 并 等 待 。 
。 第 二 个 到 达 的 线程 (FRAGA “else” WA) 将 buddy_waiting 标识 设 为 false， 唤 醒 前 一 个 线 


程 并 等 待 。 
。 第 一 个 到 达 的 线程 从 条 件 变量 的 等 待 中 被 唤醒 并 解锁 ， 因 此 将 第 二 个 到 达 的 线程 唤醒 ， 将 互 斥 锁 | 
解 开 ， 然 后 离开 该 过 程 。 549 


。 第 二 个 到 达 的 线程 从 条 件 变 量 的 等 待 中 被 换 响 醒 并 解锁 ,将 互 斥 锁 解 开 ， 并 离开 该 过 程 。 
。 仔细 观察 “让 ”和 “else” 中 等 待 和 唤醒 的 顺序 。 如 果 不 按照 这 种 顺序 ， 则 会 寻 致 死 锁 。 


boolean buddy waiting = FALSE; 
mutex lock type mtx; /* assume this has been initialized 
properly */ 
cond var_ type cond; /* assume this has been initialized 
properly */ 
wait_for_buddy() 
{ 
/* both buddies execute the lock statement */ 
thread_mutex_lock(mtx) ; 


if (buddy waiting == FALSE) { 
/* first arriving thread executes this code block */ 
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buddy waiting = TRUE; 


/* the following order is important */ 
/* the first arriving thread will execute a wait statement */ 
thread _ cond wait (cond, mtx); 


/* the first thread wakes up due to the signal from the second 
* thread, and immediately signals the second arriving thread 
*/ 

thread cond signal(cond); 


} 


else { 


/* second arriving thread executes this code block */ 
buddy waiting = FALSE; 


/* the following order is important */ 

/* signal the first arriving thread and then execute a wait 
* statement awaiting a corresponding signal from the 
* first thread 
* / 

thread cond signal (cond); 

thread cond wait (cond, mtx); 


} 


/* both buddies execute the unlock statement */ 
thread mutex_unlock (mtx); 


550 } 


条 件 变 量 数据 类 型 的 内 部 表示 。 从 编程 角度 来 理解 线程 库 中 的 cond_var_type 数据 类 型 很 
直观 。 这 种 类 型 的 变量 ， 至 少 包含 下 列 信息 : 

。 一 个 等 待 该 变量 唤醒 信号 的 线程 队列 ; 

。 每 个 等 竺 线程 等 待 时 关联 的 互 斥 锁 。 

调用 thread cond wait 的 线程 同时 给 出 了 一 个 互 斥 锁 。 线 程 库 在 将 其 放 人 等待 队 列 前 先 
解 开 这 个 锁 。 类 似 地 ， 当 收 到 该 条 件 变量 的 唤醒 信和 号 后 ， 线程 从 等 待 队列 释放 ， 线程 库 需 要 
在 将 其 重 继续 执行 该 线程 前 重新 获取 这 个 锁 。 这 就 是 线程 库 为 什么 要 在 等 待 队 列 中 记 住 与 每 
个 线程 相关 联 的 锁 。 

因此 ， 假 设 两 个 线程 T3 和 T4 在 条 件 变量 C 上 执行 条 件 等 竺 调用 时 ， 令 T3 的 调用 是 


thread _ cond wait(C, L1) 
而 T4 的 调用 是 


thread cond wait(C, L2) 


C 在 上 述 两 个 调用 后 的 内 部 表示 看 起 来 就 像 这 样 : 





名 称 





注意 一 个 给 定 条 件 变 量 的 所 有 与 等 待 操作 有 关 的 锁 并 不 一 定 需要 是 同一 个 锁 。 


假设 事件 按 下 述 顺序 发 生 (TI ~ T7 是 同一 个 进程 的 线程 ): 
T1 执行 thread_mutex_lock(L1); 
551 T2 执行 thread cond wait(Cl, L1); 
T3 执行 thread mutex lock(L2); 
T4 执行 thread cond wait(C2, L2); 
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T5 执行 thread cond wait(Cl, L2); 

a. 假设 在 此 之 前 没有 其 他 线程 库 的 调用 ， 请 写 出 上 述 5 个 调用 后 线程 库 中 内 部 队列 的 状态 ; 
b. 接着 ， 发 生 了 下 列 事 件 : 

T6 执行 thread cond signal(C1); 

T7 执行 thread cond signal(C2); 

请 写 出 上 述 两 个 调用 后 线程 库 中 内 部 队列 的 状态 。 

as 


a. 
名 称 WAR 名 称 Ue 
(ob 
f= be 

b. 


库 在 分 别 收 到 Cl 和 C2 的 唤醒 信号 后 ， 将 T2 移 到 LI1 的 等 待 队 列 ， 将 T4 移 到 L2 的 等 待 队 列 。 552 


12.2.9 ”视频 处 理 示例 的 完整 解决 方案 


我 们 现在 回 到 图 12-2 的 视频 处 理 的 例子 。 下 面 是 一 个 使 用 了 等 待 和 唤醒 语义 的 程序 示 
例 。 注 意 每 个 线程 在 检查 当前 不 为 真 的 条 件 后 进入 等 待 ， 男 一 个 线程 使 该 条 件 变 为 真 ， 最 终 
保证 一 定 没 有 死 锁 。 注 意 每 个 线程 在 持 有 互 斥 锁 时 执行 唤醒 操作 。 然 而 ， 这 并 不 是 必需 的 ， 
它 不 过 是 一 个 好 的 编程 实践 ， 并 使 并 行程 序 中 的 错误 更 少 。 


* Sample program #5: This solution delivers the expected 
* semantics for the video processing 

* pipeline shown in Figure 12.2, both 
* in terms of performance and 

* correctness for a single digitizer 

* feeding images to a single tracker. 


#define MAX 100 


int bufavail = MAX; 
image type frame_buf[MAX]; 





digitizer() tracker () 

{ { 
image type dig_image; image type track_image; 
int tail = 03 int head = 0; 
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loop { /* begin loop */ loop { /* begin loop */ 
grab(dig image); SS oy Aa er een eee ea 





thread mutex _lock(buflock); 
_ if (bufavai == MAX) — 
-thread cond _wait(buf_ (3) 
not _empty, buflock); o 
thread_mutex nock (ao 





| thread m mutex _lock (buflock); 
ae (bufavail == 0) 
(1) |. thread | cond | wait (buf_ | 
not full, buflock); | 
| thread_mutex_unlock(buflock) ; ee 
oS oe a NR epee testa omens track_image = frame buf 
frame buf[tail mod MAX] = [head mod MAX]; 
dig image; head = head + 1; 
tail = tail + 1; 














‘thread 1 mutex . lock (buflock) ; > 
_bufavail = bufavail - 1; : 

(2) | ‘thread. cond. | signal 
| (Beh not empty); 


a tne tok ae 
bufavail = bufavail thi; = 
_ thread _ cond_ | signa | | 4) 





: e not | full 
_ thread_mutex_unlock(buflock) ; thre tex unlo 


} /* end loop */ Spatial ease ities 
} } /* end loop */ 
} 


这 个 程序 示例 中 需要 注意 的 关键 是 每 个 线程 所 维护 的 不 变量 。 不 变量 是 程序 状态 的 某 个 
无 可 争议 的 表示 。 在 调用 thread cond wait 时， 不 变量 表示 调用 者 持 有 锁 。 库 隐 式 地 释放 调 
用 者 的 锁 。 当 线程 继续 执行 时 ， 就 需要 重新 建立 不 变量 。 在 继续 之 前 库 会 通过 隐 式 地 重新 获 
取 锁 来 重建 代表 阻塞 线程 的 不 变量 。 


12.2.10 ”解决 方案 的 讨论 


并 发 性 ”我们 来 分 析 示 例 程 序 #5 中 的 解决 方案 ， 并 证 明 其 中 并 不 缺乏 并 发 性 。 

。 第 一 ， 注 意 代 码 段 (1) 和 (3 ) 持 有 锁 只 是 为 了 检查 bufavail 的 值 。 如 果 检 查 产生 理想 
结果 ， 那 么 释放 锁 并 继续 或 者 放 一 个 图 像 或 者 取 一 个 图 像 。 如 果 检 查 产 生 不 理想 结果 
会 怎么 样 呢 ?” 在 这 种 情况 下 ， 代 人 码 段 会 在 buf not full 和 buf not empty 上 执行 条 件 等 
待 。 无 论 是 哪个 线程 ， 库 都 会 立即 释放 关联 的 锁 。 

。 第 二 ， 注 意 代 码 段 (2) 和 (4) 持 有 锁 只 是 为 了 更 新 bufavail 变量 ， 并 发 出 唤醒 信和 号 来 
解锁 另 一 个 (如 果 正 在 等 待 的) 线程 。 

给 出 以 上 两 点 ， 我 们 可 以 发 现 程序 并 不 缺乏 并 发 性 ， 因 为 锁 不 会 被 某 个 线程 在 其 他 阶段 

获取 。 


假设 数字 化 部 件 在 代码 段 (2) 中 并 将 通过 示例 程序 #5 中 的 buf not empty 条 件 变量 执行 唤 
醒 操 作 。 

说 明 下 列 陈述 是 正确 的 还 是 错误 的 ， 并 给 出 理由 。 

跟踪 器 能 够 保证 在 代码 段 (3 ) 中 等 待 buf not empty 的 唤醒 信和 号。 

+ an 


错误 的 。 跟 踪 器 可 以 处 于 等 待 状态 ， 但 不 是 一 直 在 等 待 。 注 意 代 码 段 (2 ) 中 的 唤醒 操作 是 无 条 件 
的 。 因 此 ， 我 们 无 需 了 解 bufavail 的 值 是 什么 。 跟 中 器 在 代码 段 (2 ) 中 会 被 阻塞 的 地 方 只 有 当 bufavail 
=MAX 时 。 我 们 知道 它 是 非 零 值 ， 因 为 数字 化 部 件 能 够 放 入 一 帧 内 容 ， 但 是 我 们 不 知道 它 等 于 MAX。 


没有 死 锁 ， 接 下 来 ， 我 们 说 明 解 决 方案 是 正确 的 且 不 会 产生 死 锁 。 首 先 ， 我 们 将 形式 化 
地 说 明 : 在 任何 时 间 点 ， 两 个 线程 不 会 都 被 阻塞 ， 即 不 会 产生 死 锁 。 
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© 假设 数字 化 部 件 在 代码 段 (1 ) 中 等 待 唤醒 信和 号。 已 知 这 一 点 ,我 们 将 说 明 跟 踪 器 也 不 
会 阻塞 从 而 导致 死 锁 。 由 于 数字 化 部 件 被 阻塞 了 ， 所 以 我 们 知道 下 列 为 真 的 事实 ， 

E bufavail=0. 

图 数字 化 部 件 被 阻塞 了 了 ， 等 待 buf not full 的 唤醒 信和 号。 

图 为 了 数字 化 部 件 buflock 被 线程 库 隐 式 地 释放 了 . 

有 3 个 可 能 导致 跟 踊 器 阻塞 的 地 方 : 

图 代码 段 (3 ) WAH: 由 于 数字 化 部 件 没 有 获取 buftock， 所 以 跟踪 器 不 会 在 人 口 处 被 
阻塞 。 

图 代码 段 (4) 的 入 口 : 由 于 数字 化 部 件 没 有 获取 buflock， 所 以 跟踪 右 不 会 在 入 口 处 被 
阻塞 。 

图 代码 段 (3 ) 中 的 条 件 等 待 语句 : 数字 化 部 件 被 阻塞 了 ， 在 代码 段 (1 ) 内 部 等 待 唤 
醒 信 号 。 因 此 ，bufavail = 0。 所 以 ， 代 码 段 (3 ) 中 的 “让 ”语句 将 返回 期 望 的 结果 ， 
跟 踩 器 不 保证 不 会 阻塞 。 

。 与 前 者 的 参数 类 似 ， 我 们 可 以 证 明 当 跟 踩 融 在 代码 段 (3 ) 中 等 待 唤醒 信号 时 ， 数 字 化 
部 件 也 不 会 阻塞 从 而 导致 死 锁 。 

其 次 ,我 们 说 明 如 果 一 个 线程 被 阻塞 了， 它 最 终 一 定 会 被 男 一 个 线程 解除 阻塞 。 

。 假设 数字 化 部 件 被 阻塞 了， 在 代码 段 (1 ) 中 等 待 唤醒 信号 。 如 我 们 之 前 所 说 明 的 ， 跟 
踪 器 可 以 无 阻塞 地 执行 其 代码 。 因 此 ， 最 终 它 会 进入 代码 段 (4 ) 中 的 唤醒 语句 。 收 到 
言 号 后 ， 数 字 化 部 件 等 待 着 重新 获得 (当前 由 跟踪 器 在 代码 段 (4 ) 中 持 有 的 ) 锁 。 注 
意 线 程 库 会 为 数字 化 部 件 隐 式 地 获取 该 锁 。 跟 踪 器 离开 了 代码 段 (4 )， 释 放 了 锁 ; 而 
数字 化 部 件 重新 获得 锁 并 移出 代码 段 (1 )， 目 己 释 放 了 锁 。 

。 用 前 面 类 似 的 方式 ， 我 们 也 可 以 证 明 当 跟踪 需 在 代码 段 (3 ) 中 等 待 唤醒 信号 时 ， 数 字 
化 部 件 也 会 发 送 唤醒 信和 号 来 解锁 跟踪 需 。 

因此 ， 我 们 形式 化 证 明了 这 个 解决 方案 的 正确 性 ， 并 且 不 会 缺乏 并 发 性 。 


12.2.11 重新 检查 条 件 


示例 程序 #5 对 这 个 拥有 一 个 数字 化 部 件 和 一 个 跟踪 器 的 例子 能 够 正确 地 工作 。 然 而 ， 总 
的 来 说 ， 条 件 变 量 的 编程 需要 更 加 谨慎 来 避免 同步 错误 。 考 虑 下 面 使 用 共享 资源 的 代码 段 。 
任意 数量 的 线程 可 以 执行 过 程 use_shared_resource, 


/* 
* Sample program #6: 
Eg 
enum state_t {BUSY, NOT_BUSY} res_state = NOT_BUSY; 
mutex_lock_type cs_mutex; 
cond var_type res not busy; 


/* helper procedure for acquiring the resource */ 
acquire shared resource() 


{ 










if (res_state == BUSY) 
thread cond wait (res_not_busy, cs_mutex); T2 is here 


res state = BUSY; 


376 #12 # 


thread_mutex_unlock(cs_ mutex); 


} 


/* helper procedure for releasing the resource */ 
release shared _ resource() 


{ 


thread _ mutex _lock(cs_mutex); 


| res state = NOT BUSY; Tl is here | 


thread_cond_signal(res_not_busy); 
thread mutex unlock(cs mutex); 


} 


/* top level procedure called by all the threads */ 
use shared resource!() 


{ 
acquire shared resouce(); 
resource specific function(); 
release shared resource(); 


} 


可 以 看 到 |; 

e T1 刚刚 使 用 完 资 源 并 且 将 res_state 设置 为 NOT BUSY。 

© T2 处 于 条 件 等 待 状态 。 

© T3 等 待 获取 cs _ mnutext。 

图 12-13 是 cs_mutex 和 res not busy 的 库 中 等 待 队列 的 状态 : 

e T2 在 res_not busy 的 队列 中 ， 而 T3 在 cs_mutex 的 队列 中 ( 见 图 12-13a)。 

e TI 在 条 件 变 量 res_not busy 上 发 出 了 唤醒 信号 ， 导 致 T2 移动 到 cs_mutex 队列 中 ， 因 
为 库 需 要 在 继续 T2 执行 前 重新 获取 cs_mutex ( 见 图 12-13b )。 





a) Æ T1 发 出 唤醒 信号 前 的 等 待 队列 b) Æ T1 发 出 唤醒 信号 后 的 等 待 队 列 


图 12-13 ”等 待 队 列 的 状态 。 一 旦 Tl 发 出 唤醒 信号 ，T2 就 离开 条 件 等 待 状态 。 但 是 ， 
cs_mutex 需要 被 T2 重新 获取 来 满足 12.2.9 节 中 的 不 变量 。 基 于 这 个 原因 ，T2 
进入 了 b 中 cs_mutex 的 等 待 队 列 


当 T1 释放 了 cs mutex In, ARE PHISH: 

。 将 锁 给 予 T3， 即 cs mutex 等 待 队列 中 的 第 一 个 线程 。 

。T3 发 现 res state 为 NOT BUSY， 释 放 cs mutex， 并 继续 使 用 资源 。 

e T2 从 thread cond wait 继续 执行 (因为 cs_mutex 现在 可 用 了 )， 释 放 cs_mutex， 也 继续 

使 用 资源 。 

现在 ， 我 们 违反 了 使 用 共享 资源 的 互 斥 条 件 。 我 们 看 看 是 如 何 导 致 这 种 情况 的 。T1 激活 
了 T2 在 发 出 信号 之 前 等 待 的 条 件 ， 但 是 T3 在 T2 继续 执行 前 将 其 无 效 化 了 。 因 此 ， 重 新 检 
查 继续 执行 的 条 件 〈 即 程序 需要 满足 的 条 件 ) 是 一 种 避免 这 种 同步 错误 的 编码 手段 。 

下 面 的 程序 段 通过 改变 与 thread cond wait 关联 的 语句 从 庄 变 为 while 来 解决 前 面 的 问 
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题 。 这 种 方法 保证 一 个 线程 在 继续 执行 时 重新 检查 条 件 从 而 在 thread_cond_ wait 被 调用 时 又 
继续 保持 阻塞 状态 。 


/* 
* Sample program #7: 
*/ 
enum state 七 {BUSY, NOT BUSY} res state = NOT BUSY; 
mutex lock type cs_mutex; 
cond Var type res not busy; 


acquire shared resource() 


thread mutex lock(cs mutex); T3 is here 





while |(res state == BUSY) 


thread cond wait (res not busy, cs _ mutex); T2 is here 
res state = BUSY; 
thread _mutex_unlock(cs_mutex); 


} 


release shared resource( ) 
{ 
thread mutex lock(cs mutex); 
res state = NOT BUSY; Tl is here 
thread cond signal(res_not_buys); 
thread _mutex_unlock(cs_mutex); 


} 


use _shared_resource() 
{ 
acquire shared resouce()j; 
resource specific function(); 
release shared _resource()j; 


} 


重 写 示例 程序 #5 来 允许 多 个 数字 化 线程 和 跟踪 器 线程 可 以 一 起 工作 。 本 例 留 作 读者 的 一 个 
练习 。 

[提示 : 在 线程 从 条 件 等 待 中 唤醒 后 重新 检查 条 件 十 分 重要 。 而 且 ， 目 前 数字 化 线程 的 实例 共享 了 
头 指针 ， 而 跟踪 器 线程 的 实例 共享 了 尾 指针 。 因 此 ， 对 这 些 指针 的 修改 需要 在 每 一 类 的 实例 之 间 进 行 互 
斥 。 为 了 保证 线程 之 间 的 并 发 性 并 减少 不 必要 的 竞争 ， 请 对 头 指针 和 尾 指 针 使 用 不 同 的 锁 来 提供 互 斥 。] 


12.3 ”线程 函数 调用 和 多 线程 编程 概念 总 结 


我 们 总 结 在 前 几 节 中 介绍 的 一 些 多 线程 编程 所 需要 的 基本 曙 数 调用 。 注 意 这 只 是 基本 调 
用 的 一 个 说 明 性 集合 ， 并 不 意味 着 是 全 面 的 。 在 12.6 节 ， 我 们 给 出 IEEE POSIX 9 标准 线程 库 
提供 的 一 个 全 面 的 函数 调用 集 。 


e thread create (top-level procedure, args); 


创建 一 个 从 top-level procedure (顶层 过 程 ) 开始 执行 的 新 线程 ， 以 args 为 过 程 所 需 的 参数 。 


èe thread terminate (tid); 


结束 线程 ID 为 tid 的 线程 。 


e thread mutex lock (mylock); 
当 线 程 返回 时 它 拥 有 了 锁 mylock。 如 果 该 锁 当 前 已 被 其 他 线程 占用 ， 那 么 将 阻塞 调用 的 


O IEEE 是 一 个 国际 性 组 织 ， 代 表 Institute of Electrical and Electronics Engineers, Inc. ; POSIX 代表 便携 式 
操作 系统 接口 (POSIX®)。 
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线程 。 
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e thread mutex trylock (mylock); 


该 调用 不 会 阻塞 调用 的 线程 。 如 果 线 程 获得 了 mylock， 则 返回 success; 如 果 锁 正 被 其 他 
线程 使 用 ， 则 返回 failure。 

e thread mutex unlock(mylock); 

如 果 调 用 的 线程 目前 已 经 有 mylock 了 ， 则 将 其 释放 ; 否则， 返回 错误 。 

e thread join (peer thread tid); 

卫 到 ID 为 peer thread id 的 线程 结束 ， 调 用 的 线程 才能 继续 执行 。 

e thread cond wait(buf not empty, buflock); 

调用 线程 阻塞 在 条 件 变量 buf not empty E; 库 隐 式 地 释放 锁 buflock。 如 果 锁 当前 不 被 
调用 的 线程 拥有 ， 则 返回 错误 。 

e thread cond signal(buf not empty); 

一 个 (如果 有 的 话 ) 等 待 条 件 变 量 buf_not_empty 的 线程 被 唤醒 。 如 果 与 被 唤醒 的 线程 相 
关联 的 ( 即 wait 调用 中 的 ) 锁 当 前 可 用 ， 则 该 线程 准备 继续 执行 ; 否则 ,线程 从 条 件 变 量 的 
队列 移动 到 相应 锁 的 队列 中 。 

为 了 提供 快速 参考 ， 表 12-2 总 结 了 我 们 在 多 线程 编程 中 介绍 过 的 一 些 重 要 概念 。 


概 念 


顶层 过 程 
程序 顺序 


并 行程 序 的 执行 模型 


不 确定 性 执行 


数据 竞争 


BF 


表 12-2 与 线程 有 关 的 概念 总 结 


定义 及 使 用 方法 

并 行程 序 的 一 个 线程 的 开始 执行 位 置 

顺序 程序 的 执行 模型 ， 它 结合 了 程序 的 文本 顺序 和 程序 员 定 义 的 程序 逻辑 (条 件 语句 、 循 
环 、 过 程 等 ) 

并 行程 序 的 执行 模型 在 每 个 线程 中 保持 程序 的 顺序 ， 但 是 允许 不 同 线程 的 指令 之 间 相 互 
交错 

给 定 的 程序 ， 对 于 一 组 给 定 的 输入 ， 每 次 运行 的 输出 结果 相同 。 顺 序 程序 展示 的 执行 模 
型 具有 这 个 属性 

对 于 同一 个 程序 的 一 组 相同 的 输入 ， 每 次 运行 可 能 产生 不 同 的 输出 结果 。 并 行程 序 的 执 
行 模型 具有 这 个 属性 | 

同一 个 程序 的 多 个 线程 在 没有 同步 的 情况 下 同时 访问 某 个 共享 的 变量 ， 其 中 至 少 一 个 访 
问 是 对 变量 的 写 操作 

同一 个 程序 的 各 个 线程 顺序 ( 即 非 并 发 地 ) 执行 的 一 种 手段 。 当 需要 在 并 行程 序 中 避免 数 
据 冲 突 时 采用 

程序 中 的 一 个 区 域 ， 在 其 中 线程 的 活动 都 是 按 顺 序 的 ， 用 于 保证 互 斥 性 

线程 的 某 种 状态 ， 此 时 该 线程 位 于 队列 中 等 待 ， 直 到 某 个 条 件 被 满足 才 可 以 继续 变 为 可 
运行 状态 

线程 的 某 种 状态 ， 此 时 该 线程 在 继续 向 下 执行 前 不 断 地 检查 某 个 条 件 是 否 被 满足 

同一 个 程序 的 一 个 或 多 个 线程 被 阻塞 了 ， 等 待 某 个 永远 不 可 能 被 满足 的 条 件 

同一 个 程序 的 一 个 或 多 个 线程 处 于 繁忙 状态 ， 等 待 一 个 永远 不 可 能 被 满足 的 条 件 

一 个 并 行程 序 的 多 个 线程 使 用 这 种 机 制 来 协调 它们 的 活动 。 最 通用 的 会 合 是 障碍 同步 。 
一 个 会 合 的 特例 是 thread join 调用 
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12.4 线程 编程 的 一 些 注 意 事项 


以 下 是 线程 编程 时 需要 牢记 的 几 个 重点 : 

1 ) 在 设计 数据 结构 时 尽 可 能 采用 能 够 加 强 线程 并 发 性 的 方式 。 

2 ) 最 小 化 互 斥 时 震 要 锁定 数据 结构 的 粒度 以 及 持 有 锁 所 需要 的 时 间 。 

3 ) 避免 低 等 待 ， 因 为 这 很 浪费 处 理 需 资源 。 

4) 对 程序 中 的 每 个 临界 区 ， 痢 要 仔细 了 解 其 中 的 不 变量 是 真 ， 以 便 确保 在 临界 区 中 不 变 
量 的 状态 被 保护 。 

5) 让 临界 区 的 代码 尽 可 能 简单 ， 使 得 手动 检查 是 否 有 和 死 锁 或 活 锁 变 得 更 方便 。 


12.5 ”使 用 线程 作为 软件 结构 抽象 
图 12-14 是 将 线程 用 作 系 统 软件 结构 抽象 的 一 些 模型 。 





a) 分 配 者 模型 b) 团队 模型 






.请 求 
队列 
c) 流水 线 模型 
图 12-14 使 用 线程 的 架构 服务 需 


诸如 文件 服务 器 、 邮 件 服务 器 和 Web 服务 器 这 样 的 软件 实体 ， 通常 在 多 处 理 器 上 执行 。 
图 12-14a 给 出 了 这 些 服务 器 的 一 个 分 配器 模型 。 当 分 配器 线程 收 到 请 求 时 将 其 分 配给 工作 者 
线程 池 中 的 某 个 线程 。 请 求 完 成 后 ， 工 作者 线程 回 到 空闲 了 地 中 。 当 请 求 数量 突破 服务 器 能 够 
处 理 的 容量 时 ， 通 过 请 求 队列 将 并 发 的 工作 量 稳定 下 来 。 调 度 者 也 提供 工作 负载 管理 器 的 功 
能 ， 通 过 增 大 或 减 小 工作 者 线程 的 数量 来 满足 需要 。 图 12-14b 是 团队 模型 ， 团 队 中 的 每 个 成 
员 直 接 访问 请 求 队列 获取 任务 。 图 12-14c 是 流水 线 模型 ， 更 适合 用 于 处 理 类 似 本 章 之 前 讨论 
的 视频 监视 的 连续 工作 的 应 用 程序 。 流 水 线 的 每 个 阶段 处 理 一 个 特定 的 任务 (例如 ， 数 字 化 
部 件 、 跟 踪 器 等 )。 

客户 端 程序 也 可 以 得 益 于 多 线程 。 线 程 增 加 了 客户 端 程序 的 模块 性 和 简洁 性 。 例 如 ， 客 
户 端 程序 可 以 使 用 线程 来 处 理 异 常 、 信 和 号， 以 及 终端 的 输入 /输出 。 


12.6 POSIX pthread 库 调用 总 结 


IEEE 通过 POSIX pthread 库 对 线程 的 应 用 程序 接口 (API) 进行 了 标准 化 。 每 种 UNIX 操 
作 系 统 都 实现 了 这 个 标准 。 这 种 标准 化 方便 了 程序 的 移植 。Microsoft Windows 并 没有 在 其 线 
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程 库 中 使 用 POSIX 标准 9。 下 面 总 结 了 一 些 最 常用 的 pthread 库 调 用 和 它们 简单 的 作用 描述 。 
奉 想 了 解 更 多 信息 ， 可 以 查看 相关 的 文档 源 (例如 ， 每 类 UNIX 系统 上 的 man WE), 


int pthread mutex init (pthread mutex t *mutex, 
const pthread mutex-attr t *mutexattr); 


mutex: 要 初始 化 的 互 斥 锁 变 量 的 地 址 。 

mutexattr : 用 于 初始 化 互 斥 锁 的 属性 变量 的 地 址 。 查 看 pthread mutexattr init 以 了 解 更 多 
信息 。 

语义 : 每 个 互 斥 锁 变 量 必须 必须 被 声明 (pthread_mutex_t) 并 被 初始 化 。 


int pthread _cond_init(pthread_cond_t *cond, 
pthread condattr_t *cond_attr); 


We 


数 

cond: 需要 初始 化 的 条 件 变 量 的 地 址 。 

cond attr: 用 于 初始 化 条 件 变 量 的 属性 变量 的 地 址 。 未 在 Linux 中 使 用 。 
语义 : 每 个 条 件 变 量 必须 被 声明 (pthread_ cond t) 并 被 初始 化 。 


int pthread_create(pthread_t *thread, 
pthread attr 七 *attr, 
void *(*start routine)(void *), 
void *arg); 


参数 

thread: 线程 标示 符 (tid) 的 地 址 。 

attr: 应 用 到 新 线程 的 属性 的 地 址 。 

start routine: 新 线程 开始 执行 的 图 数 。 

arg: 传人 start route 的 第 一 个 参数 的 地 址 。 

语义 : 函数 将 创建 一 个 新 线程 ， 建 立 执行 地 址 (通过 盯 数 名 称 传递 )， 并 将 参数 在 线程 开 
始 执行 时 传递 进去 。 将 新 创建 线程 的 线程 ID (tid) 放 到 指向 的 位 置 。 


int pthread kill(pthread_t thread, 
int signo); 


小 


参数 

hread: 发 送 唤 醒 信 号 的 线程 ID。 

signo: 发 送 给 线程 的 信号 数 。 

语义 : 用 于 向 某 个 tid 已 知 的 线程 发 送 唤醒 信号。 


int pthread join(Pthread t th, 
void **thread return) ;© 


日 ”尽管 Microsoft 没有 直接 支持 POSIX 标准 ,但 WIN32 平 台 上 用 C 开 发 多 线程 程序 的 线程 库 中 ， 大 部 分 
POSIX 的 标准 线程 调用 都 有 对 应 语义 的 函数 调用 接口 。 

© flin, Ay LAR http://linux.die.net/man/. 

© pthread 库 也 支持 通用 的 在 并 行 科学 计算 程序 中 极其 实用 的 障碍 同步 。 感 兴趣 的 读者 可 以 查看 UNIX 的 参考 
源 http://linux.die.net/man/。 
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th: 等 待 的 线程 的 tid。 

thread_return: 如 果 thread_return 不 为 NULL， 则 th 的 返回 值 存储 在 thread return 指向 的 
位 置 。th 的 返回 值 要 么 是 提供 给 pthread exit(3) 的 参数 ， 要 么 是 当 了 th 被 取消 后 的 PTHREAD 
CANCELED, 

语义 : pthread_join 将 调用 线程 的 执行 暂时 挂 起 ， 直 到 标示 符 为 也 的 线程 退出 (调用 
pthread exit(3) 或 者 被 取消 )。 


pthread t pthread self(void); 


参数 : 无 
语义 : pthread self 返 回调 用 线程 的 线程 标识 符 。 


int pthread mutex lock(pthread mutex 七 *mutex) ; 


参数 
mutex: 需要 锁定 的 互 斥 锁 变 量 的 地 址 。 
语义 : 等 待 直 到 给 定 的 互 斥 锁 被 解锁 ， 然 后 将 其 锁定 后 返回 。 


int pthread mutex_unlock(pthread_ mutex 七 *mutex); 


参数 
mutex: 需要 解锁 的 互 斥 锁 变 量 的 地 址 。 
语义 : 如 果 调 用 者 是 将 互 斥 锁 锁 起 来 的 线程 ， 那 么 解 开 该 锁 。 


int pthread_cond wait(pthread_cond_t *cond, 
pthread mutex 七 *mutex); 


W% 


数 

cond: 等 待 的 条 件 变量 的 地 址 。 

mutex: 与 cond 关联 的 互 斥 锁 变 量 的 地 址 。 

语义 : pthread_cond_wait 以 原子 化 的 方式 锁 住 互 不 锁 mutex， 并 唤醒 等 待 条 件 变量 cond. 
线程 执行 被 挂 起 ， 因 此 不 会 消耗 CPU 时 间 ， 直 到 条 件 变量 被 唤醒 。 在 pthread_cond wait 的 人 
口 处 ，mnutex 必须 被 调用 的 线程 锁定 。 在 回 到 调用 线程 前 ，pthread_cond_wait 需要 重新 获取 
mutex. 


int pthread cond signal(pthread_cond_t *cond); 


参数 
cond: 条 件 变 量 的 地 址 。 
语义 ,将 指定 的 条 件 变量 的 某 个 等 待 线程 唤醒 。 


int pthread_cond_broadcast(pthread_cond_t *cond); 


参数 
cond: 条 件 变量 的 地 址 。 
语义 : 前 一 个 调用 的 变种 ， 即 将 指定 的 条 件 变量 的 所 有 等 待 线程 唤醒 。 


void pthread exit(void *retval); 


参数 
retval: 线程 返回 值 的 地 址 。 
语义 : 终止 调用 线程 的 执行 。 
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12.7 操作 系统 对 线程 的 支持 


在 MS-DOS 这 种 PC 上 早期 极其 简单 的 操作 系统 中 ,用户 程 序 和 系统 内 核 之 间 没 有 任何 
分 离 ( 见 图 12-15 )。 因 此 ， 用 户 程 序 和 内 核 之 间 
的 线 是 假想 的 。 所 以 ， 在 用 户 和 线程 空间 之 间 进 
行 切 换 的 代价 (在 时 间 方 面 ， 等 价 于 一 个 过 程 调 
FA) 非常 小 。 这 种 结构 的 缺点 是 在 用 户 程 序 之 间 没 
有 内 存 保护 ， 因 此 一 个 错误 或 者 恶意 程序 可 以 轻 





易 地 破坏 内 核 的 内 存 空间 。 图 12-15 MS-DOS 的 用 户 与 内 核 边 界 。 

现代 操作 系统 ， 例 如 MS Windows XP, Linux, MS-DOS 是 PC 上 的 一 个 早期 操 
Mac OS X， 以 及 UNIX 通过 虚拟 内 存 机 制 提供 真正 作 系 统 。 阴 影 表 示 在 用 户 和 内 核 
的 内 存 保护 ， 我 们 在 之 前 的 章节 讨论 过 相关 话题 。 之 间 并 无 强制 的 分 呈 


图 12-16 是 这 些 操作 系统 中 用 户 进 程 和 内 存 的 内 存 空 间 示 意图 。 
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图 12-16 ”传统 操作 系统 中 的 内 存 保 护 。 在 用 户 和 内 核 之 间 有 强制 的 分 隔 


每 个 进程 在 其 自己 的 地 址 空间 里 。 在 用 户 空间 和 内 核 空 间 之 间 有 一 条 清晰 的 分 割 线 。 系 
统 调用 会 导致 保护 域 的 切换 。 既 然 我 们 对 存储 器 的 层次 体系 已 经 非常 熟悉 了 ， 我 们 可 以 发 现 
工作 集 (其 影响 了 所 有 的 存储 句 层 次 ， 从 虚拟 存储 到 处 理 帮 cache) 在 每 个 这 样 的 地 址 空间 切 
换 时 发 生 改变 。 因 此 ， 频 繁 地 在 边界 上 切换 会 降低 性 能 。 一 个 进程 控制 块 (PCB) 定义 了 一 个 
特定 的 进程 。 在 前 面 的 章节 中 ， 我 们 看 到 多 个 操作 系统 的 组 件 (例如 调度 器 、 存 储 系 统 、I/O 
FASE) 如 何 使 用 PCB。 在 传统 的 操作 系统 中 ( 即 ， 不 是 多 线程 的 )， 进 程 是 单线 程 的 。 因 
此 ，PCB 包含 的 信息 完全 说 明了 这 个 单线 程 在 处 理 器 上 的 活动 (当前 的 PC 值 、 栈 指针 值 、 通 
用 寄存 器 等 )。 如 果 一 个 进程 发 出 了 一 个 阻塞 了 当前 进程 (例如 从 磁盘 读 取 一 个 文件 ) 的 系统 
调用 ， 那 么 整个 程序 就 不 会 再 往 下 执行 了 。 

大 多 数 现代 的 操作 系统 (Windows XP, Sun Solaris, HP Tru64 等 ) 都 是 多 线程 的 。 也 
就 是 说 ， 操 作 系 统 将 一 个 运行 程序 的 状态 识别 为 所 有 构成 该 程序 的 各 个 线程 状态 的 组 合 。 
图 12- aie s 间 分 布 ， 它 既 能 支持 单线 程 程序 也 能 文 持 多 线程 程 
序 。 一 个 给 定 进程 的 所 有 线程 共享 该 进程 的 地 址 空间 。 

Te 但 是 由 于 所 有 的 线程 共享 同一 个 地 址 空间 ， 所 以 它们 在 
内 存 中 共享 同一 个 页 表 。 下 面 详细 闻 述 一 个 线程 的 计算 状态 。 线 程控 制 块 (TCB) 包含 了 一 个 
线程 相关 的 所 有 状态 信息 。 然 而 ， 包 含 于 TCB 的 信息 与 PCB 相 比 是 极 小 的 。 特 别 地 ，TCB 
包含 了 PC 值 、 栈 指针 值 以 及 通用 寄存 需 值 。 
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图 12-17 “现代 操作 系统 中 的 内 存 保 护 。 一 个 进程 可 能 有 多 个 线程 。 同 一 个 进程 中 的 所 有 
线程 共享 进程 的 地 址 空间 


将 多 线程 进程 和 单线 程 进程 的 内 存 布局 进行 比较 就 会 发 现 一 些 有 趣 的 地 方 ( 见 图 12-18 )。 
我 们 之 前 提 到 ， 一 个 给 定 进程 的 所 有 线程 共享 代码 、 全 局 数据 、 堆 的 空间 ， 因 此 栈 是 内 存 中 
仅 有 的 对 特定 线程 而 言 独特 的 部 分 。 由 于 多 线程 进程 栈 的 布局 与 仙人 掌 〈 见 图 12-18c) 在 视 
党 上 是 相似 的 ， 所 以 我 们 将 这 种 栈 称 作 仙 人 人 等 栈 。 





a) 单线 程 进程 b) 多 线程 进程 rr FEJ 
图 12-18 “单线 程 进程 和 多 线程 进程 的 内 存 布局 。 多 线程 进程 的 每 个 线程 有 自己 的 栈 


下 面 ， 我 们 来 看 一 看 实现 一 个 线程 库 要 做 的 事情 一 一 先 看 用 户 级 ， 然 后 看 内 核 级 。 
12.7.1 用 户 级 线程 566 


~ 


首先 ， 我 们 考虑 完全 处 于 用 户 级 的 实现 。 也 就 是 说 ， 操 作 系 统 只 知道 进程 的 存在 (BI [567 
线程 的 )。 然 而， 我 们 依然 可 以 在 用 户 级 实现 线程 。 换 言 之 ,线程 库 作 为 操作 系统 上 的 一 种 功 
能 存在 ， 就 像 你 拥有 可 以 给 任意 程序 使 用 的 数学 库 那 样 。 库 提供 了 之 前 讨论 过 的 线程 创建 调 
用 ， 并 支持 mutex 和 cond var 等 的 数据 类 型 及 其 相关 操作 。 程 序 希 望 向 线程 库 中 的 库 链接 发 
出 调用 ， 然 后 如 图 12-19 所 示 的 那样 变 成 了 程序 的 一 部 分 。 

操作 系统 维护 传统 的 队列 ， 即 可 调度 的 线程 ， 这 是 在 操作 系统 级 的 调度 单元 。 线 程 库 
维护 每 个 进程 的 一 个 准备 运行 的 线程 列表 ， 通 过 包含 了 对 应 于 每 个 线程 信息 的 线程 控制 块 
(TCB)。TCB 包含 了 每 个 线程 的 最 小 信息 (PC 值 、SP 值 ， 以 及 通用 寄存 器 值 )。 用 户 级 进程 
可 以 是 单线 程 的 (例如 P3 )， 也 可 以 是 多 线程 的 (Pl1、P2 )。 

读者 可 能 会 好 奇 ， 如 果 进 程 是 操作 系统 的 调度 单元 ， 那 么 用 户 级 线程 的 功能 会 怎样 。 即 
使 底下 的 平台 是 多 处 理 器 的 ， 给 定 进程 中 的 线程 也 无 法 并 发 地 执行 。 我 们 记得 : 线程 是 构建 ”[568 
软件 的 一 种 结构 化 机 制 。 这 是 提供 用 户 级 线程 的 主要 原因 。 它 们 以 协 程 的 形式 运行 ， 即 当 线 
程 执行 了 线程 同步 调用 并 将 其 阻塞 后 ， 线 程 调 度 器 就 会 选择 同一 个 进程 的 其 他 线程 运行 。 操 
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作 系 统 并 不 知道 线程 调度 融通 过 使 用 TCB 进行 的 这 种 线程 级 的 上 下 文 切换 。 在 用 户 级 切换 线 
程 的 代价 较 低 ， 因 为 切换 并 不 涉及 操作 系统 。 上 下 文 切换 的 代价 近似 等 于 在 程序 中 执行 一 个 过 
程 调用 。 因 此 ， 用 户 级 线程 提供 了 一 种 结构 化 的 机 制 ， 而 无 需 使 用 代价 高 易 的 涉及 操作 系统 的 
上 下 文 切换 。 用 户 级 线程 进行 上 下 文 切换 付出 的 直接 和 间接 代价 是 最 小 的 。( 请 参见 9.22 节 有 
关 直 接 和 间接 代价 的 一 些 细节 -) 而 且 ， 线程 级 调度 器 可 以 针对 特定 应 用 程序 进行 个 性 化 设计 。 
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图 12-19 ”用 户 级 线程 。 线 程 是 应 用 程序 进程 地 址 空间 中 的 一 部 分 。 在 这 种 意义 上 ， 在 应 
用 程序 逻辑 和 线程 库 功 能 之 间 并 无 强制 的 内 存 保护 。 男 一 方面 ， 在 用 户 和 内 核 
之 间 并 无 强制 的 分 离 


当 多 线程 进程 中 的 某 个 线程 执行 了 一 个 阻塞 系统 调用 时 会 发 生 什 么 呢 ? 这 种 情况 下 ， 操 
作 系 统 阻塞 了 整个 进程 ， 因 为 它 不 了 解 同一 个 进程 的 其 他 线程 也 可 以 运行 了 。 这 是 一 个 用 户 
级 线程 的 基本 问题 。 解 决 这 个 问题 有 几 种 不 同 的 方法 : 

1 ) 一 种 可 能 的 方法 是 封装 所 有 的 操作 系统 调用 (例如 ，fopen 变 为 thread fopen) 来 强制 
所 有 调用 都 通过 线程 库 进行 。 然 后 ， 当 某 个 进程 (例如 ,图 12-19 中 P1 T1) 执行 这 样 的 调 
用 时 ,线程 库 意识 到 执行 该 系统 调用 会 阻塞 整个 进程 。 因 此 ， 它 会 将 该 调用 推迟 到 所 有 这 个 
进程 的 线程 都 无 法 继续 运行 时 再 将 这 个 阻塞 的 调用 交 给 操作 系统 执行 。 

2 ) 第 二 种 方法 是 通过 操作 系统 的 向 上 调用 机 制 ( 见 图 12-20) SPAR at: 该 进程 
的 一 个 线程 将 要 执行 一 个 阻塞 的 系统 调用 。 这 个 警告 让 ( 库 中 的 ) 线程 调度 器 得 以 执行 线程 切 
换 或 者 推迟 该 线程 的 阻塞 调用 到 一 个 稍 后 的 时 间 。 当 然 ， 为 了 使 操作 系统 支持 这 种 回 上 调用 
方法 需要 对 操作 系统 进行 扩展 。 

在 第 6 章 ， 我 们 探究 了 不 同 的 CPU 调度 策略 。 在 这 种 背景 下 ， 我 们 看 看 线程 调度 器 如 何 
在 用 户 级 线程 之 间 进 行 切 换 。 显 然 ， 当 一 个 线程 执行 一 个 线程 库 的 同步 调用 时 ， 而 这 时 线程 
调度 器 就 可 以 用 来 切换 线程 。 类 似 地 ， 线 程 库 可 能 提供 一 个 thread_yield 调用 让 线程 可 以 目 愿 
放弃 使 用 处 理 器 并 将 执行 的 机 会 交 给 同一 个 进程 的 其 他 线程 。 我 们 在 第 6 章 中 研究 的 一 种 调 
度 方式 是 可 抢占 式 调度 。 如 果 要 在 用 户 级 实现 可 抢占 式 的 线程 调度 器 ， 线 程 调度 器 可 以 从 线 
程 请 求 一 个 时 间 中 断 ， 并 以 其 作为 执行 线程 之 间 可 抢占 式 线 程 调度 需 的 触发 硕 。 
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当前 执行 的 线程 





阻塞 对 操作 向 线程 库 的 
系统 调用 问 上 调用 





图 12-20 ”向 上 调用 机 制 。 线 程 库 注册 内 核 中 的 处 理 程序 。 阻 塞 对 操作 系统 的 调用 。 操 作 
系统 向 处 理 程 序 发 送 一 个 向 上 调用 ， 并 向 线程 库 告警 由 那个 进程 的 线程 发 出 的 
阻塞 系统 调用 


12.7.2 ”内 核 级 线程 


我 们 知道 ， 为 了 在 内 核 级 实现 线程 需要 操作 系统 的 相关 支持 : 

1 ) 一 个 进程 的 所 有 线程 在 同一 个 地 址 空间 中 和 生存。 因此， 操作 系统 需要 保证 这 些 线程 共 
享 进程 的 同一 个 页 表 。 

2) 每 个 线程 需要 有 自己 的 栈 ， 但 也 共享 其 余 的 内 存 信息 。 

3 ) 操作 系统 需要 支持 之 前 提 到 的 线程 级 同步 。 

首先 ， 我 们 考虑 对 进程 级 调度 絮 进 行 简 单 的 扩展 来 支持 内 核 中 的 线程 。 操 作 系 统 可 能 会 
实现 一 个 如 图 12-21 所 示 的 二 层 调度 絮 。 进 程 级 调度 器 管 理 进 程 中 的 由 所 有 线程 共享 的 PCB 
(页 表 、 统 计 信息 等 )。 线 程 级 调度 器 管理 TCB。 进 程 和 调度 器 分 配 进程 的 时 间 片 ， 并 在 进程 
之 间 使 用 可 抢占 式 调度 。 在 一 个 时 间 片 内 ， 线 程 级 调度 器 用 循环 方式 或 者 协同 模式 调度 该 进 
程 中 的 线程 。 对 于 后 一 种 情形 ， 线 程 自觉 地 放弃 人 处理 器， 让 同一 个 进程 的 其 他 线程 可 以 被 线 
程 级 调度 器 调度 执行 。 由 于 操作 系统 知道 线程 的 存在 ， 所 以 在 当前 执行 线程 发 出 阻塞 的 系统 
调用 (如 进行 VO 或 线程 同步 ) 时 ， 可 以 切换 到 其 他 线程 来 执行 。 

目前 的 计算 机 和 芯片 都 是 多 处 理 器 ， 如 果 一 个 进程 的 线程 不 能 利用 硬件 并 发 性 就 会 
有 极 大 的 性 能 限制 。 图 12-21 中 的 结构 让 一 个 给 定 进 程 的 线程 能 够 重合 IO 和 处 理 一 一 
这 是 在 用 户 级 线程 上 的 一 个 进步 。 为 了 完全 利用 多 处 理 器 中 的 硬件 并 发 性 ， 线 程 需要 成 
为 操作 系统 的 一 个 调度 单元 。 接 下 来 我们 讨论 Sun Solaris 线程 作为 内 核 级 线程 的 一 个 
具体 例子 。 
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图 12-21 “内核 级 线程 。 进 程 级 调度 需 使 用 进程 的 ready q 队列 。 即 使 当前 调度 进程 的 一 
个 线程 进行 了 一 个 阻塞 的 系统 调用 ， 操 作 系 统 也 可 以 通过 线程 级 调度 器 从 当前 
进程 中 选择 一 个 准备 好 的 线程 使 其 在 余下 的 时 间 片 内 运行 


12.7.3 Solaris 线程 : 一 个 内 核 级 线程 例子 
图 12-22 是 Sun Solaris 操作 系统 的 线程 结构 。 
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图 12-22 Sun Solaris 线程 的 结构 。 进 程 中 的 一 个 线程 被 绑 定 到 一 个 轻 量 级 进程 (lwp)。 
同一 个 进程 的 多 个 线程 可 以 被 绑 定 到 同一 个 lwp。 在 一 个 lwp 和 一 个 内 核 线程 
之 间 有 一 个 一 对 一 映射 。 处 理 器 调度 的 单元 是 内 核 线程 


用 户 


内 核 
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进程 是 表示 执行 程序 的 实体 。 一 个 进程 可 以 创建 任意 数量 的 包含 于 该 进程 的 线程 。 操 作 
系统 允许 线程 的 创建 者 拥有 在 该 进程 中 对 这 些 线程 调度 语义 的 控制 权 。 例 如 ， 线 程 可 以 以 完 
全 并 发 的 方式 或 者 以 协同 的 方式 运行 。 为 了 支持 这 些 不 同 的 语义 ， 操 作 系 统 承认 3 种 线程 : 
用 户 、 轻 量 级 进程 (lwp) 以 及 内 核 。 

1 ) A: 内 核 线程 是 一 种 调度 单元 。 我 们 将 看 到 它们 与 lwp 和 用 户 线程 之 间 的 关系 。 

2) lwp: Iwp( 轻 量 级 进程 ) 是 进程 在 内 核 中 的 一 种 表示 。 每 个 进程 在 启动 后 ， 就 关联 到 
一 个 不 同 的 Iwp。 在 一 个 lwp 和 一 个 内 核 线程 之 间 有 一 个 如 图 12-22 所 示 的 一 对 一 的 关联 。 男 
一 方面 ， 一 个 内 核 线程 可 以 从 任意 Iwp 上 取消 绑 定 。 操 作 系统 使 用 这 种 线程 来 实现 需要 独立 
于 用 户 级 进程 的 功能 。 例 如 ， 内 核 线程 可 以 作为 执行 设备 相关 也 数 的 载体 。 

3) RA: 顾名思义 ， 这 些 是 用 户 级 线程 。 

操作 系统 支持 的 线程 创建 调用 可 以 创建 用 户 级 线程 。 线 程 创建 调用 指定 了 新 创建 的 线程 
是 否 要 被 依附 到 某 个 已 存在 进程 的 lwp 上 或 者 分 配 一 个 新 的 lwp。 人 例如， 图 12-22 中 进程 P1 
的 线程 Tl1 和 T2。 它 们 都 以 协同 的 方式 执行 ， 因 为 它们 绑 定 到 了 同一 个 lwp。 任 意 数量 的 用 
户 级 线程 可 以 绑 定 到 一 个 lwp。 另 一 方面 ， 进 程 P1 的 线程 T3 与 Tl 或 T2 中 的 某 一 个 并 发 地 
运行 。P2 的 线程 T4 和 TS 也 是 并 发 地 执行 。 

调度 需 的 准备 队列 是 准备 运行 的 内 核 线程 集合 。 它 们 中 的 一 些 ， 根 据 其 与 lwp 的 绑 定 关 
系 ， 以 用 户 线程 或 者 进程 的 方式 执行 。 如 果 一 个 内 核 线程 被 阻塞 了 ， 关 联 的 lwp 以 及 用 户 级 
线程 也 被 阻塞 了 。 由 于 调度 单元 是 内 核 线 程 ， 所 以 如 果 底 下 的 平台 是 多 处 理 器 的 ， 那 么 操作 
系统 可 以 在 并 行 的 处 理 器 上 并 发 地 调度 这 些 线程 。 

理解 这 种 结构 中 线程 切换 的 内 在 开销 是 一 个 有 趣 的 事情 。 每 个 上 下 文 切换 都 是 从 一 个 内 
核 线程 到 另 一 个 内 核 线 程 。 然 而 ， 切 换 的 代价 变化 极 大 ， 这 取决 于 与 内 核 线 程 绑 定 的 是 什么 。 
上 下 文 切 换代 价 最 小 的 形式 是 在 绑 定 到 同一 个 lwp 的 两 个 用 户 级 线程 之 间 ( 见 图 12-22 中 的 
Tl 和 T2 )。 假 定 进程 在 用 户 级 有 一 个 线程 库 。 因 此 ， 线 程 的 开销 完全 处 于 用 户 级 (类似 之 前 
讨论 的 用 户 级 线程 )。 在 同一 个 进程 的 lwp 之 间 〈 见 图 12-22 中 的 Tl 和 T3 ) 切换 是 代价 稍 高 
的 一 种 上 下 文 切换 。 这 种 情况 下 ， 直 接 开 销 (保存 和 加 载 TCB) 是 通过 内 核 执 行 切换 的 时 间 。 
由 于 存储 器 的 层次 架构 ， 这 种 切换 没有 隐藏 的 开销 ， 因 为 线程 处 于 同一 个 进程 内 。 代 价 最 高 
的 上 下 文 切换 是 在 不 同 进程 的 两 个 Iwp 之 间 ( 见 图 12-22 中 的 T3 和 T4)。 这 种 情况 下 ， 直 接 
和 间接 的 代价 都 会 涉及 ， 因 为 线程 处 于 不 同 进程 中 。 


12.7.4 线程 和 库 
与 在 用 户 级 或 者 内 核 级 实现 


/* original version */ | /* thread safe version */ 


线程 的 选择 无 关 的 是 ， 保 证 多 线 | 
| mutex_lock_type cs_mutex; 
void *malloc(size t size) 


| 
| 4 
| 
| 


程 程序 使 用 库 的 安全 性 是 十 分 重 void *malloc(size t size) 
要 的 。 比 如 ， 一 个 进程 的 所 有 线 
程 共享 一 个 堆 。 因 此 ， 支 持 动态 
内 存 分 配 的 库 就 需要 认识 到 线程 
可 能 同时 癌 堆 请 求 内 存 。 拥 有 这 return(memory pointer); return (memory pointer); 

些 库 调 用 的 线程 安全 封装 以 便 保 

证 原子 性 是 极其 实用 的 。 图 12-23 ”图 12-23 ” 库 调 用 的 线程 安全 封装 。 整 个 函数 封装 在 一 个 互 斥 
是 一 个 例子 。 其 中 的 库 调用 隐 式 锁 的 lock 和 unlock 之 间 来 保证 原子 性 


thread_mutex_lock(cs_mutex) ; 


thread _mutex_unlock(cs_mutex); 
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我 们 来 看 一 看 为 了 支持 多 线程 需要 哪些 硬件 的 支持 。 有 3 件 需要 考虑 的 事情 : 
1 ) 线程 创建 和 终止 。 | 

2) 线程 之 间 的 通信 。 

3 ) 线程 之 间 的 同步 。 


12.8.1 线程 创建 、 终 止 以 及 线程 间 的 通信 


首先 ， 我 们 考虑 单 处 理 器 的 情况 。 一 个 进程 的 多 个 线程 共享 同一 个 页 表 。 在 一 个 单 处 理 
器 上 ， 每 个 进程 有 一 个 独立 的 页 表 。 在 进行 同一 个 进程 内 的 线程 上 下 文 切换 时 ，TLB 或 者 
cache 没有 改变 ， 因 为 所 有 的 内 存 映射 和 cache 的 内 容 与 新 线程 依然 是 相关 的 。 因 此 ， 线 程 的 
创建 和 终止 ,或 者 线程 之 间 的 通信 ， 都 不 需要 任何 特殊 的 硬件 支持 。 


128.2 ”线程 之 间 的 同步 


我 们 思考 一 下 实现 互 斥 锁 需 要 什么 。 我 们 需要 一 个 初始 值 为 0 的 内 存单 元 mem lock。 其 
语义 如 下 : 如 果 mem lock 是 0， 那 么 锁 处 于 可 用 状态 。 如 果 mem lock #1, MACAAK 
个 线程 获取 了 该 锁 。 下 面 就 是 lock 和 unlock 的 算法 : 


Lock: 
if (mem lock == 0) 
mem lock = 1; 
else 
block the thread; 


Unlock: 
mem lock = 0; 

lock 和 unlock 算法 需要 是 原子 的 。 我 们 看 一 看 上 述 算法 是 否 符合 该 条 件 。unlock 算法 是 处 
理 器 上 的 一 个 单独 的 内 存 存储 指令 。 由 于 每 条 指令 的 执行 是 原子 的 ， 所 以 unlock 也 是 原子 的 。 

实现 lock 算法 一 定 会 经 过 的 数据 通路 如 下 : 

。 读 取 内 存 中 茶 个 位 置 。 

。 判断 该 值 是 否 为 0。 

。 将 内 存 中 该 位 置 的 值 设 置 为 1。 


12.8.3 ”原子 的 Test-and-Set 指令 


我 们 知道 LC-2200 ( 见 第 2 章 ) ISA 没有 提供 任何 单条 指令 可 以 原子 地 执行 上 述 数据 通路 
的 操作 。 因 此 ， 为 了 让 lock 算法 具有 原子 性 ， 我 们 介绍 一 条 新 指令 : 


Test-And-Set memory-location 

这 条 指令 的 语义 如 下 所 述 : 

。 将 内 存 特 定单 元 的 当前 值 读 人 寄存 做 。 

。 将 该 内 存单 元 设置 成 1。 

这 条 指令 的 关键 点 是 ， 如 果 线 程 执行 了 该 条 指令 ， 那 么 前 两 个 操作 (获取 内 存 中 某 个 值 
并 设置 成 新 的 值 1 ) 是 原子 的 。 也 就 是 说 ， 在 执行 Test-and-Set 期 间 不 会 有 (其 他 线程 的 ) 指 


多 线程 编程 与 多 处 理 器 


令 与 其 交错 执行 。 


用 本 考虑 下 列 名 为 binary-semaphore 的 过 程 : 


static int shared-lock = 0; /* global variable to 


both T1 and T2 */ 


/* shared procedure for Tl and T2 */ 
int binary-semaphore(int L) 


{ 
int X; 


X = test-and-set (L); 


/* X = 0 for successful return */ 


return(X); 


} 


两 个 线程 Tl Fo T2 同时 执行 下 列 语句 : 
MyX = binary semaphore(shared-lock); 


其 中 MyX 是 TI1 和 T2 各自 的 局 部 变量 。 
那么 ，T1 和 T2 可 能 得 到 的 返回 值 是 什么 ? 


x. 


A e. 
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注意 指令 test-and-set # E Fi. Ab, RÆ TI 和 T2 同时 执行 过 程 ， 但 指令 的 语义 保证 其 中 一 定 


有 一 个 先 执 行 这 条 指令 。 


所 以 ， 可 能 的 结果 是 : 


1 ) Tl 先 执 行 。 


那么 T1 的 MyX=0; T2 的 MyX=1. 


2 ) T2 先 执行 。 


那么 Tl 的 MyX=1; T2 的 MyX=0. 
注意 Tl 和 T2 不 可 能 同时 得 到 0 或 者 1 的 返回 值 。 


你 也 许 听 说 过 并 且 看 到 过 广泛 运用 于 铁路 上 的 信号 量 信号 系统 。 古 时 (甚至 在 某 些 发 展 
中 国家 的 今天 ) 在 一 个 高 杆 灯 上 的 机 械 臂 ( 见 图 12-24) 用 来 在 火车 接近 共享 的 铁轨 时 提醒 
火车 司机 停 下 或 者 通过 。 





图 12-24 铁路 信号 量 


计算 机 科学 家 借用 了 信号 量 这 个 术语 。 例 12-14 中 的 过 程 是 一 个 二 元 信 


许多 线程 中 发 出 信号， 


告诉 每 个 线程 是 否 可 以 安全 地 进入 一 个 临界 区 。 


号 量 。 即 ， 它 在 
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Edsger Dijkstra， 着 名 的 集 兰 计算 机 科学 家 ， 首 先 提 出 使 用 信号 量 作为 协调 并 发 线程 活动 
的 一 种 同步 机 制 。 他 提出 了 这 种 信号 量 的 两 个 版 本 。 二 元 信号 量 是 我 们 刚才 看 到 的 一 种 ， 其 
中 的 信号 量 向 一 组 相互 苑 争 的 线程 提供 或 者 拒绝 对 一 个 资源 的 访问 。 计 数 信 号 量 是 一 个 更 通 
用 的 版 本 ， 用 于 当 一 个 资源 有 个 实例 时 ,信号 量 可 以 向 竞争 的 线程 提供 或 者 拒 接 对 这 nn 个 
资源 的 访问 。 在 任意 时 间 点 ， 可 以 有 至 多 nn 个 线程 同时 共享 这 些 资源 。 


12.8.4 ”使 用 Test-and-Set 指令 的 Lock 算法 


介绍 了 原子 的 test-and-set 指令 ， 我们 就 可 以 来 看 一 看 互 斥 锁 原 语 的 实现 ， 而 这 正 是 多 线 
程 应 SI SRNAAEE HIG MA.. 我 们 可 以 通过 建立 二 元 信号 量 来 实现 lock-and-unlock 算 
法 ， 如 下 所 示 。 

#define SUCCESS 0 

#define FAILURE 1 


int lock(int L) 
{ 


int X; 
while ( (X = test-and-set (L)) == FAILURE ) { 
/* current value of L is 1 
* implying that the lock is 
on T in use 
st. 
block the thread; 
/* the threads library puts the 
* the thread in a queue; when 
* lock is released it allows 
=~ * this thread to check the | 
‘os availability of the lock again 
” 
} 
/* falling out of the while loop = that 
pe the lock — - was successful o 
yo n 
return (SUCCESS); 
} 5 
int unlock(int L) 
{ : 
L = 0; 
return (SUCCESS); 
3 


当 线程 调用 lock 算法 得 到 返回 结果 时 ， 说 明 其 已 经 获得 该 锁 。 使 用 这 个 基本 的 lock-and- 
unlock 算法 ， 我 们 可 以 建立 12.2 节 中 讨论 过 的 同步 机 制 〈 例 如 ， 互 斥 锁 和 条 件 变量 )， 以 及 
12.6 节 总 结 的 POSIX 线程 库 。 

因此 ， 多 线程 所 需 的 最 小 硬件 支持 是 一 个 原子 的 test-and-set (简称 TAS) 指令 。 这 个 指令 
的 关键 属性 是 它 对 内 存单 元 进行 原子 化 的 读 取 、 修 改 以 及 写 人 。 还 有 其 他 实现 了 相同 功能 的 
指令 。 在 现代 的 处 理 器 架构 中 ， 都 在 其 资源 库 中 实现 一 条 甚至 多 条 拥有 该 属性 的 指令 。 

注意 ， 如 果 操 作 系统 直接 处 理 线程 ， 那 么 为 了 保存 原子 性 ， 它 可 以 在 Lock 算法 执行 时 简 
单 地 关闭 中 断 。TAS 指令 允许 在 用 户 级 执行 Lock- 
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顾名思义 ， 多 处 理 需 由 一 个 计算 机 中 的 多 个 处 理 需 组 成 ， 共 享 所 有 内 存 、 总 线 和 输入 / 
输出 设备 等 资源 ( 见 图 12-25 )。 这 就 是 所 谓 的 对 称 多 处 理 机 (SMP)， 因 为 系统 资源 对 于 所 有 
处 理 青 一视同仁 。SMP 是 增加 系统 性 能 的 一 种 代价 较 高 的 方法 ， 因 为 其 增加 了 整个 系统 的 开 
销 。 很 多 我 们 日 常生 活 中 使 用 的 服务 器 ( Web 服务 器 、 文 件 服务 器 、 邮 件 服 务 器 ) 都 在 4 路 
或 者 8 路 的 SMP 上 运行 。 





图 12-25 “对称 多 处 理 器 (SMP)。 系 统 资源 对 所 有 处 理 器 一 视 同仁 


当 程序 运行 在 多 处 理 融 上 时 ， 在 系统 级 上 就 会 比较 复杂 了 。 这 种 情况 下 ， 一 个 给 定 程 序 
的 线程 可 以 运行 在 不 同 的 物理 处 理 右 上 。 因 此 ， 系 统 软件 〈 即 操作 系统 和 运行 时 库 ) 和 硬件 需 
要 协同 工作 来 提供 在 用 户 程 序 级 上 对 线程 共享 的 数据 结构 所 期 望 得 到 的 语义 。 

即使 是 在 一 个 单 处 理 器 上 ， 我 们 也 可 以 看 到 几 个 与 维持 顺序 程序 的 语义 、 硬 件 和 软件 实 
体 相 关联 的 复杂 之 处 : TLB 、 页 表 、 缓 存 和 内 存 管理 器 等 。 读 者 可 以 想象 当 系统 软件 和 硬件 
在 保证 多 线程 程序 语义 时 的 复杂 性 。 我 们 将 在 本 市 讨论 这 些 问 题 。 

系统 (硬件 和 操作 系统 一 起 ) 需要 保证 三 件 事情 : 

1 ) 同一 个 进程 的 多 个 线程 共享 同一 个 页 表 。 

2) 即使 在 不 同 的 物理 处 理 器 上 ， 同 一 个 进程 的 多 个 线程 所 看 到 的 内 存 层次 是 一 样 的 。 

3 ) 在 并 发 执行 时 ， 线 程 可 以 保证 进行 同步 操作 时 的 原子 性 。 


12.9.1 页 表 


处 理 器 如 图 12-25 所 示 的 那样 共享 物理 内 存 。 因 此 ， 操 作 系统 通过 共享 内 存 中 的 页 表 对 
给 定 进程 的 所 有 线程 都 是 相同 的 来 满足 第 一 个 需求 。 然 而 ， 有 一 些 与 多 处 理 婴 上 的 操作 系统 
有 关 的 问题 。 理 论 上 ， 每 个 处 理 器 独立 地 执行 同一 个 操作 系统 。 然 而 ， 为 了 保证 系统 完整 性 
它们 需要 对 一 些 执行 决策 进行 协调 。 它 们 执行 特定 协调 好 的 操作 来 维持 多 线程 程序 的 语义 。 
这 些 包括 : 在 不 同 处 理 器 上 同时 调度 同一 进程 的 线程 ; 页 蔡 换 ; 维护 每 个 CPU 上 的 TLB 项 
的 一 致 性 。 这 些 问 题 超出 了 本 书 的 讨论 范围 。 但 是 这 些 问 题 值得 深入 探讨 ， 我 们 也 茵 励 谈 者 
参加 操作 系统 方面 的 高 级 课程 来 进行 进一步 研究 。 


12.9.2 分 级 存储 体系 


每 个 CPU 有 自己 的 TLB 和 缓存 。 我 们 之 前 说 过 ， 操 作 系 统 十 分 关心 TLB 的 一 致 性 ， 以 
便 保证 所 有 线程 看 到 的 共享 进程 地 址 空间 是 相同 的 。 缓 存 由 硬件 管理 。 每 个 处 理 器 的 缓存 当 
前 可 以 缓存 相同 内 存单 元 的 内 容 。 因 此 ， 硬 件 需 要 负责 维护 可 能 在 每 个 处 理 器 的 缓存 上 缓存 
的 共享 内 存 的 一 致 性 ( 见 图 12-26 )。 我 们 将 其 称 为 多 处 理 器 缓存 一 致 性 问题 。 
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图 12-27 说 明了 缓存 一 致 性 问题 。 线 程 T1、T2 A T3 (属于 同一 个 进程 ) 分 别 在 处 理 器 
P1, P2 和 P3 上 执行 。 三 者 都 在 此 时 将 单元 X 的 
内 容 缓 存在 自己 的 缓存 里 ( 见 图 12-27a)。T1 向 
X 写 入 。 此 时 ,硬件 有 两 种 选择 : 

。 将 对 等 缓存 中 X 的 拷贝 无 效 化 ， 如 图 12- 

27b 所 示 。 这 需要 在 共享 总 线 上 加 入 一 条 

失效 线 。 相 应 地 ， 绥 存 通过 在 其 上 面 侦 听 

来 监控 总 线 上 从 对 等 缓存 传 来 的 无 效 化 请 

求 。 根 据 总 线 上 的 这 种 请 求 ， 每 个 缓存 检 ” 图 12-26 每 个 处 理 器 拥有 自己 缓存 的 SMP。 

查 该 单元 是 否 在 本 地 缓存 。 如 果 是 ， 则 组 硬件 保证 每 个 处 理 器 上 的 缓存 内 容 

存 无 效 化 该 单元 。 接 下 来 同一 单元 的 缺失 是 一 致 的 

要 人 么 通过 拥有 最 新 找 由 的 缓存 来 满足 (本 例 中 的 Pl1)， 要 么 通过 内 存 来 满足 ， 取 决 于 使 

用 的 写 和 策略。 我 们 将 这 种 解决 方案 称 作 写 入 无 效 化 协议 。 

。 更 新 对 等 缓存 中 X 的 拷贝 ， 如 图 12-27c 所 示 。 这 可 能 表现 为 总 线 上 的 一 个 内 存 写 人 操 

作 。 对 等 缓存 观察 到 了 这 个 总 线 请 求 ， 更 新 它们 X 的 拷贝 (如 果 在 缓存 中 )。 我 们 将 这 

种 解决 方案 称 作 写 入 更 新 协议 。 

侦 听 缓存 是 一 个 流行 的 基于 总 线 的 缓存 一 致 性 协议 的 术语 。 在 本 节 中 ,我们 展示 一 个 非 
常 基 本 的 、 直 观 的 应 对 多 人 处理 器 缓存 一 致 性 问题 的 解决 方案 。 如 果 处 理 髓 没有 共享 的 总 线 
(一 个 广播 媒介 )， 那 么 侦 听 缓存 的 方案 就 无 法 实现 了 。 在 12.10.2 节 ， 我 们 将 讨论 一 种 不 同 的 
方案 ， 称 为 基于 目录 的 方案 ， 这 种 方案 将 不 依赖 共享 总 线 来 进行 处 理 需 之 间 的 通信 。 在 20 t 
纪 80 年 代 的 中 后 期 ， 绥 存 一 致 性 问题 的 可 伸缩 方案 是 一 个 研究 话题 ， 并 因此 产生 了 几 篇 博士 
论文 。 读 者 可 以 参加 计算 机 系统 结构 方面 的 高 级 课程 ， 从 而 在 这 方面 进行 更 深入 的 学 习 。 








b) 写 入 无 效 化 协议 c). 写 人 更 新 协议 
图 12-27 ”多 处 理 器 缓存 一 致 性 问题 及 其 解决 方案 
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考虑 下 列 SMP (对 称 多 处 理 器 ) 的 细节 : 
缓存 一 致 性 协议 : 写 入 无 效 化 
缓存 到 内 存 的 协议 : 回 写 
初始 时 ，cache AS; 且 内 存单 元 
A 包含 10，B 包含 5。 
考虑 下 列 来 自 处 理 器 P1、P2 和 P3 的 内 存 访问 的 时 间 表 : 


时 间 GEIF) EAE P ET 
ONE as es 


E 人 人 7 


根据 这 些 信息 ， 说 出 缓存 的 活动 和 其 中 存储 的 内 容 
ge 


[| . 


(1 表示 缓存 位 置 是 无 效 的 。NP 表示 不 存在 数据 。) 


mO | e | ae na 


elwlwlw | : 


12.9.3 保证 原子 性 


在 设计 上 ，CPU 共享 SMP 内 的 内 存 。 因 此 ，( 12.8 节 中 的 ) lock 和 unlock 算法 在 多 处 理 
器 中 能 够 很 好 地 工作 。 关 键 的 需求 是 在 线程 并 发 地 在 不 同 处 理 器 上 执行 时 保证 这 些 算法 的 原 
子 性 。 例 如 ， 像 (12.8 节 中 的 ) TAS 指令 自动 这 样 原子 地 进行 读 取 -修改 - 写 入 共享 内 存单 元 
就 可 以 很 好 地 完成 这 个 功能 。 


12.10 ”高 级 话题 
我 们 将 向 读者 介绍 一 些 多 处 理 右 和 多 线程 方面 的 高 级 话题 。 


12.10.1 操作 系统 话题 


死 锁 “在 12.2.7 节 中 ， 我 们 介绍 了 死 锁 和 活 锁 的 概念 。 这 里 ,我 们 将 死 锁 的 概念 归纳 并 
予以 推广 。 我 们 可 以 简单 上 且 直 观 地 定义 死 锁 为 ， 当 一 个 线程 等 待 一 个 永 不 可 能 发 生 的 事件 时 
的 情况 。 死 锁 在 计算 机 系统 中 发 生 ， 存 在 多 个 原因 。 一 个 原因 是 系统 中 有 并 发 的 活动 ， 但 是 
硬件 和 软件 资源 却 又 是 有 限 的。 例如 ,我们 考虑 一 个 运行 多 个 应 用 程序 的 单 处 理 器 。 如 采 调 
度 器 使 用 非 抢占 式 算 法 ， 运 行 在 处 理 器 上 的 应 用 程序 进入 了 一 个 无 限 循环 ， 那 么 其 他 的 所 有 
程序 都 进入 死 锁 状态 。 这 种 情况 下 ， 进 程 都 在 等 待 一 个 物理 资源 ， 即 处 理 器 。 这 种 死 锁 通 稼 
称 为 资源 死 锁 。 导 致死 锁 的 条 件 有 两 方面 : 一 个 是 访问 共享 资源 (处 理 器 ) BR eR, H 
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— SER SAS BS SMA. 

当 锁 要 管理 一 个 复杂 应 用 中 的 不 同 数据 结构 时 也 会 发 生 类 似 的 事情 。 我 们 考虑 一 个 有 趣 
的 类 比 。Nick 及 其 同伴 到 娱乐 中 心 玩 壁球 。 那 里 只 有 一 个 场 和 两 个 球拍 。 有 两 个 服务 台 分 别 
用 于 登记 场地 和 球拍 。Nick 及 其 同伴 先 去 登记 领 球拍 再 去 登记 场地 。Alex 及 其 同伴 也 有 类 似 
的 计划 ， 只 是 他 们 打算 先 去 登记 场地 再 去 登记 领 球拍 。 现 在 Nick 和 Alex 就 死 锁 了 。 这 是 一 
个 资源 死 锁 问题 。 除 了 之 前 说 的 导致 死 锁 的 两 个 原因 外 ， 这 种 情况 下 也 有 两 个 原因 导致 了 死 
锁 问 题 : 循环 等 待 ( Alex 等 着 Nick 放弃 拍子 ，Nick 等 着 Alex 放弃 场地 )， 以 及 他 们 每 一 边 可 
以 手 握 一 种 资源 并 等 着 另 一 个 的 事实 。 复 杂 的 系统 软件 使 用 细 粒 度 的 锁 来 加 强 线程 执行 的 并 
发 性 。 例 如 ,考虑 工资 单 的 处 理 。 文 票 签 发 进程 可 能 会 锁定 所 有 雇员 的 记录 来 生成 薪水 支票 ， 
而 绩效 加 薪 进 程 可 能 会 扫 拉 数据库， 锁定 所 有 雇员 的 记录 并 给 员工 加 薪 。 每 个 进程 的 持 有 并 
等 待 和 循环 等 待 导致 了 死 锁 。 

总 之 ,计算 机 系统 中 涉及 进程 间 资 源 死 锁 问题 有 下 列 必 须 同时 满足 的 条 件 : 

BR: 一 个 资源 只 能 在 互 斥 方式 下 使 用 。 

。 无 抢占 : 持 有 一 个 资源 的 进程 自愿 放弃 。 

。 持 有 并 等 待 : 一 个 进程 允许 在 等 待 其 他 资源 时 持 有 一 个 资源 。 

。 循 环 等 待 : 在 等 待 资源 的 进程 之 间 有 循环 依赖 的 关系 ( 4 等 待 由 B 持 有 的 一 个 资源 ; B 

等 待 由 C 持 有 的 一 个 资源 ; CX; X SRR A 持 有 的 一 个 资源 )。 

这 些 是 死 锁 的 必要 条 件 。 有 3 种 处 理 死 锁 的 策略 : 死 锁 避免 、 预 防 和 检测 。 对 这 些 策略 
感 兴趣 的 读者 可 以 翻阅 操作 系统 方面 的 高 级 教材 (例如 ，[Tanenbaum，2007 ; Silberschatz, 
2008])。 这 里 我 们 给 出 这 些 策 略 最 基础 直观 的 内 容 。 死 锁 避 免 算 法 是 极其 保守 的 。 它 基本 上 
假定 资源 的 请 求 模 式 是 先 验 知识 。 因 此 ， 算 法 可 以 做 出 拥有 不 会 导致 死 锁 的 资源 分 配 策略 。 
例如 ， 如 果 你 手 上 有 $100， 而 且 你 清楚 在 最 坏 情 形 下 你 需要 $80 来 度 过 这 个 月 余下 的 日 子 ， 
你 就 知道 你 可 以 给 朋友 借 出 $20。 如 果 你 朋友 需要 $30， 你 只 能 说 不 ， 因 为 那样 你 就 有 可 能 
进入 一 种 无 法 顺利 度 过 这 个 月 的 情况 了 。 然 而 ， 这 个 月 你 可 能 有 几 顿 午饭 或 晚饭 是 免费 吃 的 ， 
那样 就 不 需要 $80 To 所 以 ， 你 做 出 的 关于 能 借 给 朋友 多 少 钱 的 策略 是 一 个 基于 最 坏 情形 下 
的 保守 策略 。 你 可 能 猜 到 了 ， 死 锁 避 免 会 由 于 其 内 在 的 保守 性 导致 资源 利用 率 低 下 。 

更 加 重要 的 是 ， 死 锁 避 免 并 不 实用 ， 因 为 它 需 要 未 来 资源 请 求 的 先 验 知 识 。 一 个 更 好 的 
策略 是 死 锁 预防 ， 防 止 出 现 上 述 4 个 死 锁 的 必要 条 件 。 其 基本 思路 是 破坏 某 个 必要 条 件 ， 从 
而 防止 系统 死 锁 。 还 是 用 前 面 借 钱 的 那个 例子 ， 你 可 以 给 你 朋友 供出 $30。 但 是 ， 如 果 发 现 
这 个 月 你 需要 $80， 你 就 从 借 给 朋友 的 $30 中 再 要 回 $10。 这 种 策略 破坏 了 “无 抢占 ”的 必要 
条 件 。 当 然 ， 同 样 的 预防 策略 可 能 无 法 适用 于 所 有 资源 种 类 。 例 如 ， 如 果 进 程 需 要 以 互 太 方 
式 访问 一 个 单独 的 物理 共享 资源 ， 那 么 避免 死 锁 的 方式 是 有 与 请 求 者 数量 一 样 多 的 共享 资源 。 
这 可 能 看 起 来 有 些 疯狂 ， 不 过 仔细 想 想 ， 这 就 是 一 个 部 门 打 印 机 的 共享 方式 。 简 单 地 说 ,我 
们 对 打印 任务 进行 假 脱 机 ， 即 将 任务 缓存 ， 然 后 等 待 物理 打印 机 就 绪 。“ 假 脱 机 ”或 者 “缓存 
是 破坏 必要 条 件 “ 互 斥 ” 的 一 种 方式 。 类 似 地 ， 为 了 使 条 件 “ 持 有 并 等 待 ”不 成 立 ， 我 们 可 
以 命令 所 有 资源 需要 在 开始 进程 前 同时 获取 。 用 壁球 的 例子 ，Nick (ak Alex) 需要 同时 登记 
场地 和 球拍 ， 而 不 是 先 登 记 其 中 的 一 个 。 最 后 ， 关 于 条 件 “ 循 环 等 待 " ， 我 们 可 以 给 资源 确定 
顺序 ， 要 求 所 有 请 求 必 须 按 顺序 进行 。 例 如 ， 我 们 要 求 你 必须 在 请 求 球拍 (资源 可 ) 前 先 去 
申请 场地 (资源 #l )。 这 就 能 保证 不 会 出 现 循环 等 街 。 

死 锁 预 防 可 以 比 死 锁 避免 获得 更 好 的 资源 利用 率 。 然 而 ， 它 依然 是 一 个 保守 方案 。 例 如 ， 
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在 进程 开始 前 要 求 其 获得 所 有 资源 ， 这 一 定 可 以 预防 死 锁 的 产生 ， 但 是 该 进程 并 不 需要 在 整 
个 这 段 时 间 内 使 用 所 有 资源 ， 那 么 资源 就 被 浪费 了 -. 因此 ， 一 个 更 好 的 策略 是 死 锁 检测 与 恢 
复 ， 这 种 方法 让 资源 请 求 和 授权 可 以 更 自由 地 进行 。 如 果 一 个 死 锁 发 生 了 ， 我 们 可 以 通过 一 
种 机 制 发 现 它 并 予以 恢复 。 用 壁球 的 例子 ， 当 一 个 前 台 工 作 人 员 注 意 到 死 锁 后 ， 她 会 从 Nick 
那儿 拿 来 球拍 ， 叫 上 负责 球拍 的 同事 ， 并 让 她 把 Alex 叫 到 前 台 来 解决 死 锁 问题 。 


考虑 一 个 包含 了 3 种 资源 的 系统 : 1 个 显示 器 ，1 个 键盘 ，1 个 打印 机 。 
有 4 个 进程 : 
PI 需要 所 有 的 3 种 资源 
P2 需要 键盘 。 
P3 需要 显示 器， 
P4 需要 键盘 和 显示 器 ， 
解释 如 何 使 用 死 锁 避免 、 预 防 和 检测 来 分 别 满足 4 个 进程 的 需求 。 
5 


我 们 考虑 每 种 策略 的 解决 方法 。 

避免 : 在 一 个 进程 开始 时 将 所 有 需要 的 资源 捆 在 一 起 进行 分 配 。 此 时 ， 如 果 P1 正在 运行 ， 那 么 
P2、P3、P4 就 不 会 运行 了 ; 如 果 任 何 的 某 一 个 正在 运行 ， 那 么 P1 就 不 能 开始 了 。 

预防 : 我 们 人 为 地 定义 资源 的 顺序 一 一 键盘 、 显 示 器 、 打 印 机 。 所 有 进程 总 是 按照 上 面 的 顺序 请 求 
资源 ， 在 完成 时 则 野 放 所 持 有 的 资源 。 这 保证 了 不 会 出 现 循环 等 待 (P4 无 法 持 有 显示 器 再 请 求 键盘 ; 
PI 无 法 在 已 经 持 有 显示 器 时 再 请 求 打印 机 ， 等 等 )。 

检测 : 允许 资源 独立 地 以 任意 顺序 被 请 求 。 我 们 假设 所 有 进程 都 可 以 重新 开始 。 如 果 进 程 P2 请 求 
一 个 资源 (比如 ,键盘 )， 而 它 当 前 分 配给 了 为 一 个 进程 P4， 如 果 P4 正在 等 待 另 一 个 资源 、 那 么 就 会 强 
制 让 P4 释放 键盘 ， 将 键盘 分 给 P2， 并 重新 开始 执行 P4。 


一 个 在 资源 分 配 中 与 死 锁 密切 相关 的 话题 是 饥饿 ， 即 某 个 进程 等 待 资 源 时 无 限期 被 阻塞 
的 情形 。 例 如 ， 如 果 资 源 按 照 某 种 优先 级 进行 了 分 配 ， 如 果 有 一 串 高 优先 级 的 进程 不 断 请 求 
同一 个 资源 ， 那 么 低 优 先 级 的 进程 可 能 出 现 饥饿 问题 。 回 到 壁球 场 的 例子 ， 假 如 教工 的 优先 
级 高 于 学 生 ， 那 么 学 生 就 会 出 现 “ 饥 俄 ” 现 象 。 我 们 在 之 后 讨论 同步 的 经 典 问题 时 会 给 出 另 
一 个 饥饿 的 例子 。 

除了 资源 死 锁 外 ， 计 算 机 系统 对 其 他 形式 的 死 锁 也 非常 敏感 。 尤 其 是 在 本 章 前 面部 分 讨 
论 的 死 锁 类 型 ， 即 写 出 正确 并 行程 序 过 程 中 的 可 能 导致 死 锁 或 活 锁 的 那 种 错误 。 这 个 问题 在 
分 布 式 系统 上 会 加 剧 ( 见 第 13 章 )， 因 为 那里 的 消息 可 能 由 于 各 种 原因 在 传输 中 丢失 ， 从 而 导 
致 了 死 锁 。 所 有 的 这 些 情形 都 可 以 归结 为 通信 死 锁 。 

高 级 同步 算法 ”在 本 章 中 ,我 们 已 经 学 习 了 基本 的 同步 概念 。 这 种 概念 已 经 体现 在 IEEE 
标准 中 ， 例 如 POSIX 线程 库 。 如 我 们 之 前 观察 到 的 ， 这 些 库 及 其 变种 包含 于 几乎 所 有 的 现代 
操作 系统 中 。 大 多 数 并 行 系统 的 应 用 软件 都 是 用 这 些 多 线程 库 构 建 起 来 的 。 

涉及 互 斥 锁 和 条 件 变 量 的 编程 比较 困难 而 且 容 易 出 错 。 主 要 原因 是 共享 数据 结构 的 同步 
访问 逻辑 贯穿 于 整个 程序 中 ， 使 得 这 种 编程 从 软件 工程 角度 来 看 就 变 得 较为 困难 了 。 这 种 难 
度 体 现在 大 型 复杂 并 行程 序 的 设计 、 开 发 以 及 维护 上 。 

我 们 将 并 发 编程 的 需求 归结 为 3 件 事情 : 

1) 线程 以 互 斥 的 方式 ( 即 ， 串 行 地 ) 执行 程序 中 的 某 些 部 分 (我们 在 12.2.4 市 中 提 到 的 
临界 区 ) 的 能 力 。 
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3 ) 线程 通知 另 一 个 可 能 等 竺 着 某 个 条 件 满足 的 线程 的 能 

管 程 是 一 种 由 Brinch Hansen 和 Tony Hoare 在 20 世纪 70 年 代 提 出 来 的 编程 概念 ， 用 于 
满足 前 面 提 到 的 需求 。 管 程 是 一 个 抽象 数据 类 型 ， 包 含 了 操作 这 些 数据 结构 所 需 的 数据 结构 
和 过 程 。 用 现代 编程 语言 (例如 ，C++ 或 Java 等 ) 中 的 术语 来 讲 ， 我们 可 以 把 管 程 看 作 在 句 
法 上 与 之 类 似 的 对 象 。 我 们 来 看 看 一 个 Java 对 象 和 管 程 之 间 的 区 别 。 主 要 的 区 别 是 在 任意 时 
间 点 ， 一 个 管 程 内 只 能 有 恰好 一 个 活动 的 线程 。 换 言 之 ， 如 果 需 要 在 程序 中 设立 临界 区 ， 那 么 

需要 把 那 部 分 程序 用 管 程 实现 。 如 果 一 个 程序 需要 多 个 独立 的 临界 区 (比如 ， 例 12-7 的 例子 )， 

那么 就 需要 用 多 个 管 程 来 构造 ， 其 中 的 每 一 个 管 程 都 对 应 一 个 临界 区 。 管 程 中 的 一 个 线程 可 能 
会 在 需要 一 个 资源 时 被 阻塞 。 为 此 ， 管 程 提 供 了 条 件 变 量 ， 并 提供 了 两 个 操作 ，wait (等 待 ) 和 
notify (通知 )。 读 者 可 以 直接 看 到 管 程 中 的 条 件 变 量 与 pthread 库 中 的 条 件 变量 之 间 的 对 比 。 管 
程 概念 满足 了 上 述 3 个 写 并 发 程序 时 的 需求 。 为 了 验证 这 是 对 的 ， 我 们 来 看 一 个 例子 。 


B 12-17 对 本 章 中 视频 处 理 的 例子 给 出 用 管 程 实现 的 解决 方案 。 
a 


数字 化 部 件 和 跟踪 器 的 代码 已 经 写 好 了 ， 并 假设 有 一 个 名 为 FrameBuffer WEE. KF BAR 
踪 器 中 的 grab 和 analyze 过 程 处 于 管 程 外 部 。 


digitizer() 
{ 


image type dig image; 


loop { 
grab(dig image); 
FrameBuffer.insert(dig image) ; 
} 
} 


tracker() 


{ 


image type track_image; 


loop { 
FrameBuffer.remove_image(&track_image) ; 
analyze(track_image) ; 


} 


monitor FrameBuffer 
{ 


#define MAX 100 


image type frame _buf[MAX]; 
int 0 = MAX; 2 3 





condition not_full, not_empty; 
void insert_image(image_ type image) 
{ lee 
u (butavail == Oy 
wait (not_ full); : 
frame _ buf [tail mod MAX] = image; 
tail = F ma + ae : 
e aravadi an us 1 
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/* tracker could be waiting */ 
notify(not_empty); 
} 


if (bufavail == MAX) 
wait(not_empty); 
*image = frame buf{head mod MAX]; 
“head = head + 1; 
bufavail = bufavail + 1; 
if (bufavail == 1) { 
/* digitizer could be waiting */ 
notify(not_full); 
y 


} 
void remove_image(image_type *image) 


} 





} /* end monitor */ 





例 12-17 的 解答 中 有 几 点 需要 注意 的 地 方 。 最 重要 的 一 点 是 ，pthread 版 本 里 贯穿 于 数字 
化 部 件 和 跟 踊 器 过 程 中 的 同步 和 缓冲 区 管理 的 细节 在 管 程 FrameBuffer 中 被 巧妙 地 隐藏 了 。 这 
就 简化 了 数字 化 部 件 和 跟踪 需 过 程 的 代码 ， 只 需 实现 需要 的 功能 即 可 。 这 样 保 证 了 最 终 的 程序 
与 使 用 少量 同步 概念 的 版 本 相 比 会 更 少 出 错 些 。 这 种 解决 方案 的 另 一 个 优雅 之 处 在 于 ， 应 用 程 
序 中 可 以 有 任意 数量 的 数字 化 部 件 和 跟踪 需 线 程 。 根 据 管 程 概念 的 语义 〈 互 斥 )， 所 有 线程 在 管 
程 内 部 的 调用 都 会 串 行 化 。 总 的 来 说 ， 管 程 概念 明显 地 提升 了 并 行程 序 软件 工程 的 效率 。 

读者 可 能 会 好 奇 ， 如 果 管 程 是 这 样 一 个 美妙 的 概念 ， 为 什么 我 们 现在 不 使 用 它 ? 主要 的 
原因 是 ， 它 是 一 个 编程 概念 。 在 例 12-17 P, RIIA C 风格 的 语法 编写 了 一 个 管 程 ,与 本 章 
之 前 的 视频 处 理解 决 方案 相 兼 容 。 但 是 ，C 不 文 持 管 程 概念 。 我 们 当然 可 以 通过 “模拟 ”的 
方式 ， 使 用 操作 系统 已 有 的 工具 实现 管 程 (例如 pthread 库 ; 见 练习 21 )。 

有 些 程序 设计 语言 已 经 采纳 了 管 程 的 想法 。 例 如 ，Java 是 一 个 面向 对 象 的 程序 设计 语 
言 ， 支 持 用 户 级 线程 ， 人 允许 方法 ( 即 过 程 ) 组 合 到 一 起 形成 所 谓 的 类 。 通 过 在 方法 前 加 上 
“ synchronized ”关键 字 ，Java 保证 在 运行 时 的 任意 时 刻 ， 恰 好 只 有 一 个 用 户 级 线程 可 以 执行 
一 个 给 定 对 象 上 的 同步 方法 。 换 言 之 ， 当 线程 开始 执行 一 个 synchronized 方法 后 ， 其 他 线程 
就 不 允许 再 执行 同一 对 象 中 的 同步 方法 。 其 他 没有 “synchronized ”关键 字 的 方法 依然 可 以 并 
发 地 执行 ， 只 需 保证 只 有 一 个 同步 方法 正在 执行 。Java 没有 与 管 程 条 件 变量 类 似 的 内 置 数据 
结构 ， 但 是 它 提供 了 wait 和 notify 限 数 来 允许 在 同步 方法 内 阻塞 或 继续 其 中 线程 的 执行 ( 见 
练习 22 )。 

多 处 理 器 上 的 调度 ”在 第 6 章 中 ， 我 们 介绍 了 多 个 处 理 需 调度 算法 。 它 们 也 适用 于 并 行 
系统 。 然 而 ， 在 多 个 处 理 器 上 ， 调 度 融 需 要 选择 执行 一 个 应 用 中 的 多 个 线程 还 是 不 同 应 用 的 
多 个 线程 。 这 提供 了 一 些 有 趣 的 选项 。 

在 不 同 处 理 器 上 调度 线程 的 最 简单 方法 是 有 一 个 由 每 个 处 理 需 上 的 调度 需 共享 的 单独 的 
数据 结构 (一 个 运行 队列 ) CULPA 12-28 )。 这 也 同时 保证 了 所 有 处 理 需 同等 地 共享 (运行 线程 
的 ) 计算 负载 。 

这 种 方法 有 一 些 问题 。 第 一 个 问题 就 是 分 级 存储 体系 的 污染 。 在 现代 的 拥有 多 级 缓存 的 
处 理 器 上 ， 对 需要 进入 远离 处 理 器 级 的 访问 有 明显 的 时 间 损 失 (更 多 细节 参考 第 9 章 )。 考 虑 
在 处 理 器 P2 上 运行 的 线程 T1， 它 运行 完 自己 的 时 间 片 后 ， 需 要 切换 出 上 下 文 环境 。 通 过 一 
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个 中 心 队 列 ，T1 可 能 被 某 个 其 他 处 理 需 ， 比 如 P5， 在 下 一 个 时 间 片 选中 。 我 们 来 看 一 看 为 什 

[589] 么 这 不 是 一 个 令 人 满意 的 情况 。T1 占用 的 大 部 分 内 存 也 许 依然 在 处 理 器 P2 较 近 的 级 上 。 因 
此 ， 如 果 T1 在 下 一 时 间 片 依然 运行 在 P2 上 ， 可 能 遇 到 的 缓存 缺失 会 更 少 。 也 就 是 说 ，T1 与 
P2 有 紧密 度 。 那 么 ， 对 于 基本 调度 算法 ， 一 种 在 多 处 理 器 上 的 改进 就 是 使 用 缓存 紧密 度 ， 一 
项 首先 由 Vaswani 和 Zahorjan 提出 的 技术 。 每 个 处 理 器 上 的 调度 队列 ( 见 图 12-29 ) 可 以 比 
一 个 共 诗 队列 更 好 地 帮助 管理 线程 以 及 它们 与 特定 处 理 带 的 关系 。 为 了 负载 均衡 ， 发 现 自己 
已 经 做 完工 作 的 处 理 硕 《队列 为 空 ) 可 能 会 从 其 他 处 理 需 的 调度 队列 中 进行 任务 窃取 。 另 一 
种 对 调度 算法 的 改进 是 对 当前 持 有 互 斥 锁 的 线程 增加 时 间 片 长 度 。 其 原理 来 自 于 一 个 事实 ， 
即 同一 个 程序 的 其 他 线程 可 能 直到 当前 线程 释放 锁 后 才能 开始 真正 运行 。 这 项 技术 也 是 由 
Zahorjan 提出 的 。 图 12-29 是 每 个 处 理 带 内 调度 队列 的 概念 图 。 
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图 12-28 PERERA AAAA RE AA A BAA 


oE.. oa 


图 12-29 tb a ED a EBA, BE A BA), AEEA 
fir LAY Dal ES ARV A C AIRANI AN eA PKA 





我 们 将 向 读者 介绍 两 个 让 多 处 理 器 调度 更 有 效 的 技术 ， 对 于 多 线程 应 用 程序 而 言 ， 它 们 
尤为 有 效 。 第 一 个 称 为 空间 共享 。 其 想法 是 给 一 个 应 用 程序 ， 在 其 生命 周期 内 ， 共 享 一 组 处 
理 器 。 在 程序 开始 时 ， 向 应 用 程序 分 配 与 线程 数 一 样 多 的 处 理 器 。 调 度 器 会 等 到 有 这 么 多 可 
用 的 空闲 处 理 器 后 才 开始 运行 该 程序 。 由 于 一 个 处 理 器 分 配给 一 个 线程 ， 所 以 就 没有 上 下 文 
切换 的 开销 〈 而 缓存 紧密 度 也 能 得 到 维持 )。 如 果 一 个 线程 由 于 同步 或 者 VO 阻塞 了 ,那么 处 
理 器 周期 就 被 简单 地 浪费 了 。 这 项 技术 向 应 用 程序 提供 了 优秀 的 服务 ， 但 是 会 有 浪费 资源 的 
风险 。 对 空间 共享 基本 想法 的 一 个 修改 是 应 用 程序 可 以 根据 系统 的 负载 扩大 或 缩小 CPU 的 需 
求 。 例 如 ， 如 果 系统 只 能 提供 10 个 处 理 器 ,那么 一 个 需要 20 个 线程 的 Web 服务 器 会 把 需要 
的 线程 数 降 到 10。 之 后 ， 若 系统 有 更 多 可 用 的 处 理 器 ，Web 服务 器 可 以 声明 并 增加 更 多 的 线 

oo) 程 并 运行 在 那些 处 理 器 上 。 


多 线程 编程 与 多 处 理 器 
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一 个 空间 共享 调度 器 会 将 系统 中 的 所 有 处 理 器 分 成 不 同 大 小 的 分 区 ( 见 图 12-30) 且 每 


次 分 配 分 区 给 应 用 程序 ， 而 不 是 分 配给 单个 处 理 器 。 
这 减少 了 调度 器 需要 维护 的 用 于 统计 的 数据 结构 数 . 
读者 应 该 会 联想 到 我 们 在 第 7 章 中 学 习 的 固定 大 小 
分 区 的 内 存 分 配 。 与 内 存 管理 方案 类 似 ， 空 间 共 享 
可 能 导致 内 部 碎片 。 比 如 ， 如 果 一 个 应 用 程序 需要 
6 个 处 理 器 ， 它 会 得 到 包含 了 8 个 处 理 器 的 分 区 ， 
而 其 中 的 2 个 处 理 需 则 会 在 应 用 程序 执行 期 间 保持 
空闲 状态 。 

我 们 要 介绍 的 最 后 一 个 技术 是 组 调度 。 它 对 空间 
调度 技术 进行 了 补充 。 考 虑 如 下 情形 : 线程 T1 持 有 
一 个 锁 ; T2 正在 等 待 锁 。TI1 释放 了 锁 , 但 T2 当前 
并 未 被 调度 ， 所 以 没有 利用 刚刚 可 用 的 这 个 锁 的 优 
势 。 应 用 程序 可 能 被 设计 成 使 用 细 粒 度 的 锁 ， ang 
程 只 持 有 一 个 锁 很 短 的 一 段 时 间 。 在 这 样 的 情形 下 ， 
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000 


图 12-30 ”调度 器 创建 了 4 个 分 区 来 共享 
空间 。 其 中 包括 了 两 个 2 处 理 
fit PK; 一 个 4 处 理 峰 分 区 ; 
以 及 一 个 8 处 理 器 分 区 


应 用 程序 的 工作 效率 将 遭受 极 大 损失 ， 


ee ate ERN eee 
个 应 用 程序 相关 的 线程 以 组 的 形式 进行 调度 ， 因 此 称 作 组 调度 。 每 个 线程 在 不 同 的 CPU 上 运 
行 。 然 而 ， 与 空间 共享 相 比 ，CPU 并 不 专属 于 某 个 线程 ， 而 是 时 间 共 享 的 。 


组 调度 按 下 述 方式 工作 : 
。 时 间 分 为 固定 大 小 的 片 。 
。 所 有 CPU 在 每 个 时 间 片 开始 时 调度 。 


。 调度 需 使 用 组 的 原则 把 处 理 需 分 配给 一 个 给 定 应 用 程序 的 线程 。 

。 不 同 组 可 以 在 不 同时 间 片 内 使 用 同一 组 处 理 需 。 

。 多 个 组 可 以 同时 被 调度 ， 取 决 于 处 理 需 的 可 用 情况 。 

。 一旦 被 调度 了 ,线程 到 处 理 副 的 关联 会 保持 到 下 一 个 时 间 片 开始 前 ， 即使 线程 被 阻塞 


了 《〈 即 处 理 融 会 处 于 空闲 状态 )。 


组 调度 在 其 调度 决策 中 考虑 了 缓存 紧密 度 。 图 12-31 说 明了 3 个 组 如 何 使 用 组 调度 原则 


在 空间 和 时 间 上 共享 6 个 CPU。 


组 1 在 组 1 在 
P1-P4 E; P1-P4 E; 
组 3 在 组 2 在 组 3 在 组 2 在 
PS-P6 上 P1-P6 上 P5-P6 上 Pl-P6 上 
上 t A] 
to ti t2 t3 t4 t5 t6 t7 
组 1 在 2 在 组 1 在 组 2 在 
P1-P4 上 上 ; Pl-P6 上 P1-P4 上 ; P1-P6 上 
组 3 在 组 3 在 
P5-P6 上 P5-P6 上 


图 12-31 对 3 个 不 同 的 组 进行 组 调度 的 时 间 线 。 组 1 需要 4 个 处 理 器 ; 组 2 需要 6 个 处 


Shak; 组 3 需要 2 个 处 理 带 


总 之 ,我 们 介绍 了 4 种 用 来 增加 多 处 理 句 上 CPU 调度 效率 的 技术 : 


。 缓存 紧密 度 调度 。 
e 基于 锁 的 时 间 片 扩展 。 


0 E E 


。 空间 共 军 。 

。 组 调度 。 

多 处 理 融 调度 需 也 许 会 组 合 地 使 用 上 述 技术 来 使 效率 最 大 化 ， 这 取决 于 系统 要 完成 的 工 
作 量 。 最 后 要 说 明 的 是 ， 这 些 技术 在 顶层 ， 与 每 个 处 理 需 中 使 用 的 短期 调度 算法 结合 在 一 起 
使 用 (关于 短期 调度 算法 可 以 参考 第 6 章 )。 

有 关 并 发 的 经 典 问题 我 们 将 在 这 里 介绍 一 些 有 关 并 发 的 经 典 问题 ， 这 些 问题 在 推进 并 
行 系统 中 的 同步 上 做 出 了 很 大 贡献 。 

1 ) 生产 者 - 消费 者 问题 : 这 也 称 为 有 界 缓冲 区 问题 。 本 草 中 的 视频 处 理应 用 程序 就 是 一 
个 生产 者 - 消费 者 问题 的 实例 。 生 产 者 不 停 地 向 一 个 共享 的 数据 结构 中 放 和 人 东西 ， 消 费 者 不 
扬 地 从 里 面 拿 出 东西 。 这 是 很 多 程序 中 都 会 发 生 的 一 个 常见 的 通信 范例 。 适 用 该 通信 范例 的 
任何 应 用 程序 都 可 以 建 模 为 一 个 流水 线 。 

2) 读者 - 写 者 问题 : 我 们 假设 你 正在 尝试 获取 一 个 球赛 的 门票 。 你 进入 了 一 个 网 站 ， 例 
如 Ticketmaster.com 网 站 ， 选 择 特 定 日 期 球赛 的 门票 ， 并 检查 是 否 还 有 座位 。 你 可 能 看 了 其 他 
选项 ， 例 如 关于 票 价 和 座位 方面 ， 然 后 最 终 锁定 在 一 组 座位 上 然后 购买 了 球 票 。 当 你 在 做 这 
件 事 情 时 ， 可 能 有 数 百 个 其 他 的 体育 迷 也 在 寻找 并 且 购 买 同 一 天 同一 场 的 球 票 。 直 到 你 真 的 
买好 了 想 要 的 票 ， 在 此 之 前 这 些 座 位 依然 是 可 以 被 任何 人 选择 购买 的 。 数 据 库 包 含 了 所 有 关 
于 不 同日 子 的 座位 是 否 可 用 的 信息 。 查 看 座位 是 否 可 用 是 数据 库 上 的 一 个 读 操 作 。 同 时 可 能 
会 有 很 多 个 读者 浏览 数据 库 检 查 座位 的 可 用 性 。 购 买 球 票 则 是 数据 库 上 的 一 个 写 操作 。 这 个 
操作 要 求 对 数据 库 的 互 斥 访问 〈 至 少 是 对 数据 库 一 部 分 的 互 斥 访问 )， 即 在 执行 号 人 期 间 没 有 
其 他 读者 。 

上 面 的 例子 是 经 典 的 读者 - 写 者 问题 的 一 个 实例 ， 它 在 1971 年 由 Courtois 等 人 提 
出 。 该 问题 的 一 个 简单 直接 的 解决 方案 是 : 当 读 者 在 数据 库 中 时 ， 人 允许 新 的 读者 进来 ， 
因为 他 们 不 需要 互 斥 访问 。 当 一 个 写 者 进来 后 ， 如 果 当 前 还 有 其 他 读者 在 数据 库 中 ,， 那 
么 就 让 他 暂时 等 待 。 一 旦 所 有 读者 都 退出 了 数据 库 ， 就 让 写 者 独占 地 进行 操作 。 相 反 ， 
如 果 写 者 在 数据 库 中 ， 直 到 写 者 退出 数据 库 阻 塞 所 有 的 读者 。 这 种 使 用 互 斥 锁 的 方案 如 
图 12-32 所 示 。 

仔细 考虑 这 个 简单 的 方案 ， 我 们 立刻 就 能 发 现 其 中 的 缺点 。 由 于 读者 无 需 互 斥 访问 ， 所 
以 当 至 少 有 一 个 读者 在 数据 库 中 时 ， 新 的 读者 可 以 继续 进入 数据 库 。 这 导致 了 与 者 的 饥饿 问 
题 。 修 复 这 个 问题 可 以 这 样 : 当 一 个 新 的 读者 希望 进入 时 ,检查 是 否 有 等 待 的 写 者 ， 如 果 有 
就 让 读者 在 写 者 后 进入 ( 见 练习 题 23 ~ 26). 

3 ) 哲学 家 就 餐 问 题 : 这 是 一 个 由 Dijkstra (1965) 提出 的 著名 的 同步 问题 。 自 提出 后 ， 
任何 新 的 同步 方法 都 会 使 用 这 个 问题 作为 检验 方法 来 看 看 提出 的 新 方案 能 够 多 有 效 地 解决 这 
个 问题 。5 个 哲学 家 围 着 一 张 圆桌 而 坐 。 他 们 在 吃饭 和 思考 之 间 转 换 状 态 。 果 子 中 央 有 一 碗 意 
大 利 面 。 每 个 哲学 家 有 自己 单独 的 盘子 。 一 共有 5 个 叉子 ， 每 个 叉子 在 两 个 哲学 家 之 间 ， 如 
图 12-33 所 示 。 当 一 个 哲学 家 想 吃 饭 时 ， 他 会 拿 起 两 边 挨 着 他 的 叉子 ， 从 中 间 的 硫 中 拿 一 些 
意大利 面 到 自己 的 盘子 里 吃 。 一 旦 吃 完 了 ， 他 会 放下 又 子 并 继续 思考 ” 。 


日 ”这 些 哲 学 家 不 在 乎 个 人 卫生 ， 因 此 会 在 旁边 的 人 用 过 后 继续 用 他 们 可 能 用 过 的 又 子 ! 
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mutex lock type readers count lock, database lock; 
int readers count = 0; 


void readers() 
{ 
lock(read_count_lock); /* get exclusive lock 
* for updating readers 
* count 
*/ 
if (readers count == 0) { 


/* first reader in a new group, 


* obtain lock to the database 
*/ 
lock(database_ lock); 
/* note only first reader does this, 
* so in effect this lock is shared by 
* all the readers in this current set 
*/ 
} 
readers count = readers count + 1; 
unlock(read_count _lock); 
read_dabatase(); | | 
lock(read_count_lock); /* get exclusive lock 
= * for updating readers 
* count 
*/ 
readers count = readers count — 1; 
if (readers count == 0) { 
/* last reader in current group, 
* release lock to the database 
*/ 
unlock(database lock); 
} 
unlock(read_count_lock); 
} 


void writer() 
{ 


lock(database_lock); /* get exclusive lock */ 
write dabatase(); 


unlock(database_ lock); /* release exclusive lock */ 





图 12-32 BE — 5 PRT RL Ee BES 


这 个 问题 需要 确保 每 个 哲学 家 在 不 妨碍 其 他 人 的 前 提 下 吃饭 和 思考 。 换 言 之 ， 每 个 哲学 
家 是 一 个 独立 执行 的 线程 ， 我 们 和 希望 他 们 能 够 最 大 并 发 地 做 吃饭 和 思考 这 两 件 事 。 思 考 无 需 
协调 ， 因 为 它 是 独立 的 。 另 一 方面 ， 吃 饭 需 要 协调 ， 因 为 每 两 个 临近 的 哲学 家 之 间 有 一 个 共 
享 的 叉子 。 

一 种 简 年 的 解 愉 方案 是 让 每 个 哲学 家 事先 同 全 在 合 又 了 时 按照 顺 订 子 拿 起 一 个 〈 比 如 先 拿 
左边 的 )， 然 后 拿 起 右边 的 又 子 ， 最 后 才 开 始 吃 。 这 种 解决 方案 的 问题 是 它 并 不 能 工作 。 如 果 
每 个 哲学 家 同时 拿 起 左边 的 又 子 ， 每 个 人 都 等 着 取 右 边 的 叉子 ， 而 这 个 叉子 已 经 被 在 边 的 邻 
居 拿 走 了 。 这 就 导致 出 现 了 死 锁 的 循环 等 待 条 件 . 

我 们 来 勾勒 出 一 个 可 能 正确 的 方案 。 我 们 在 思考 和 吃饭 之 间 加 入 一 个 中 间 状 态 ， 
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饿 。 在 饥 狐 状态 下 ， 哲 学 家 会 答 试 拿 起 两 个 又 子 。 如 果 成 功 了 ， 他 会 继续 进入 吃饭 状 
态 。 如 果 他 没有 同时 拿 到 两 个 义 子 ， 他 会 一 直 尝 试 拿 直 到 成 功 拿 到 两 个 又 子 为 止 。 怎 样 
允许 一 个 哲学 家 同时 拿 起 两 个 义 子 呢 ?” 此 时 他 的 两 个 邻居 应 当 都 不 在 吃饭 状态 。 而 且 ， 
他 希望 在 他 尝试 拿 义 子 时 两 个 邻居 没有 改变 状态 。 一 旦 吃 完了 ,他 将 自己 的 状态 变 为 思 
考 ， 并 人 简单 地 通知 相 邻 的 两 个 哲学 家 ,这样 如 果 他 们 饿 了 就 可 以 尝试 吃饭 了 。 图 12-34 
给 出 了 哲学 家 就 餐 问 题 的 使 用 管 程 的 解决 方案 。 注 意 当 一 个 哲学 家 试图 通过 take_forks 
去 拿 义 子 时 ， 管 程 (保证 任意 时 间 点 只 有 一 个 活动 的 线程 在 其 内 部 ) 确保 没有 其 他 哲学 
家 能 够 更 改 他 的 状态 。 





图 12-33 ”就 餐 的 哲学 家 5 : 一 个 饿 了 的 哲学 家 拿 起 靠近 他 两 边 的 两 只 又 子 开 吃 ， 并 在 吃 
完 后 将 其 放下 


void philosopher(int i) 
{ 
loop {/* forever */ 
do_some_thinking(); 
DiningPhilosphers.take forks(i); 
eat(); 


DiningPhilosophers.put_down_forks(i); 





12-34 a) 每 个 哲学 家 线程 执行 的 代码 


© ”图 片 来 源 : http://commons.wikimedia.org/wiki/File:Dining_philosophers.png。 
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Wi en 。 
e | oe z- 

#define N 5 

#define THINKING 0 

| #define HUNGRY 1 

#define EATING 2 

_#define LEFT ((i+N-1) mod N) 
 #define RIGHT (G41) mod n) 


condition phil _waiting[N]; ye one for each philosopher 
int Lae 一 m state of each pni losogher a — 


void take forks (ant i) 
<. — — oh 
phil _state = mene; Le 
repeat _ -n 
u i (phil_ State[LEFT] EATING) cy -o 
(phil _State[RIGHT] t= EATING) — 
pbk. Ace ， 一 EATING; e 
else : a 
wait (phil et es ~ 


_ until (phil Atateid] ， == Th 
ae ee — 


o phil state[i] = THINKING; | 
oa annan, _waiting[LEFT}) ; /le 


notity(phil _vattingt arom); /ei 


/* monitor initi 





2} /* end monitor #/ ts 


图 12-34 b) FPA ACHE] E E 


12.10.2 ”架构 话题 


在 12.9 市 中 ， 我们 介绍 了 多 人 处理 带 。 我 们 将 稍微 深入 讨论 有 关 并 行 架构 方面 的 高 级 话题 。 

硬件 多 线程 ”流水 线 处 理 器 使 用 指令 级 并 行 ( ILP)。 然 而 ,根据 我 们 在 第 5 章 和 第 9 章 
提 到 的 ， 指 令 级 并 行 由 于 各 种 因素 有 其 限制 ， 包 括 分 支 、 有限 的 功能 单元 ， 以 及 处 理 需 核 内 
存 之 间 日 益 加 大 的 时 间 周 期 差距 。 比 如 ， 绥 存 缺 失 会 导致 流水 线 的 停滞 ， 严 重 性 随 发 生 缓 存 
缺失 的 等 级 而 增加 。 需 要 芯片 外 处 理 的 缓存 缺失 导致 CPU 需要 等 待 数 十 个 时 钟 周期 。 在 多 线 
程 程序 中 ， 有 另 一 个 有 效 使 用 处 理 需 资源 的 方式 ， 即 运行 所 有 就 绪 的 线程 。 这 就 是 所 谓 的 线 
程 级 并 行 (TLP)。 通 过 TLP， 硬 件 级 别 的 多 线程 巧妙 地 减少 了 由 于 ILP 限制 带 来 的 流水 线 停 
游 的 影响 。 
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我 们 可 以 用 一 个 例子 来 进行 类 比 。 想 象 一 队 人 正在 一 个 银行 柜员 前 等 待 服务 。 一 个 顾客 
走向 柜员 ,柜员 发 现 该 顾客 需要 在 业务 办 理 完成 前 先 填 完 一 张 表 。 柜 员 非 常 聪明 ， 她 要 求 顾 
客 在 旁边 填写 这 张 表 ， 并 开始 处 理 下 一 个 顾客 的 业务 。 当 第 一 个 顾客 填 完 表格 后 ， 柜 员 转 向 
他 并 完成 一 开始 的 那个 业务 。 柜 员 可 能 会 让 多 个 需要 填 表 格 的 顾客 在 旁边 填 表 ， 从 而 让 队列 
的 移动 更 为 迅速 。 

便 件 多 线程 与 这 个 现实 生活 中 的 例子 十 分 相似 。 单 处 理 需 就 是 银行 柜员 。 顾 客 是 独立 的 
线程 。 可 能 导致 处 理 需 停滞 的 长 延迟 操作 就 是 顾客 的 填 表 行为 。 当 线程 处 于 一 个 长 延迟 操作 
中 时 (例如 ， 绥 存 缺 失 导 致 需要 访问 内 存 )， 处 理 器 就 会 从 另 一 个 准备 就 绪 的 线程 中 获取 下 一 
条 指令 执行 。 因 此 ， 就 像 银 行 柜 员 一 样 ， 处 理 吕 有效 地 利用 了 资源 ， 即 使 一 个 或 多 个 就 绪 的 
线程 卡 在 长 延迟 操作 上 。 自 然 地 ， 这 也 提出 了 几 个 问题 。 处 理 器 如 何 知道 有 多 个 线程 准备 运 
ÍT? 操作 系统 如 何 知 道 可 以 同时 在 一 个 相同 的 物理 处 理 需 上 调度 多 个 线程 运行 ?处 理 咒 怎样 
维持 每 个 线程 之 间 的 状态 (PC、 寄 存 闫 等) ? 这 种 技术 只 是 为 了 提高 多 线程 应 用 程序 的 运行 
速度 ， 还 是 对 顺序 程序 也 有 效 ? 我 们 将 在 接 下 来 的 几 个 段 中 解答 这 些 问题 。 

便 件 中 的 多 线程 是 另 一 个 硬件 与 系统 软件 之 间 合 作 的 例子 。 处 理 需 架构 指定 了 硬件 上 能 
够 处 理 多 少 个 并 发 的 线程 。 在 Intel 架构 上 ， 这 称 为 逻辑 处 理 器 的 个 数 ， 表 示 为 保持 线程 状态 
之 间 的 区 别 所 需 人 硬件 资源 的 副本 的 等 级 。 每 个 旬 辑 处 理 吉 有 其 自己 的 PC 和 寄存 需 堆 。 操 作 
系统 允许 一 个 应 用 程序 将 一 个 线程 绑 定 到 一 个 逻辑 处 理 锅 上 。 在 12.7 节 中 我 们 讨论 了 线程 级 
调度 所 需 的 操作 系统 支持 。 通 过 处 理 多 个 逻辑 处 理 希 ， 操 作 系统 能 够 同时 调度 多 个 就 绪 线程 
使 其 在 处 理 器 上 执行 。 物 理 处 理 需 通过 寄存 需 推 、PC、 页 表 等 的 副本 集 来 维护 每 个 逻辑 处 理 
器 的 独立 角色 。 因 此 ， 当 一 个 特定 逻辑 处 理 需 上 的 一 条 指令 进入 流水 线 时 ， 处 理 器 就 知道 为 
了 指令 执行 所 需 访 问 的 与 线程 相关 的 人 硬件 资源 。 

一 个 多 线程 应 用 程序 通过 硬件 对 多 线程 的 支持 来 增加 效率 ， 因 此 即使 一 个 线程 由 于 ILP 
限制 被 阻塞 了 ， 同 一 个 程序 的 其 他 线程 也 可 以 获得 继续 运行 的 机 会 。 不 幸 的 是 ， 如 果 一 个 程 
序 是 单线 程 的 ， 那 么 它 就 无 法 从 硬件 的 多 线程 上 获得 好 处 从 而 加 快 执行 速度 。 但 是 ， 硬 件 多 
线程 依然 能 够 帮助 提升 系统 整体 的 吞吐 量 。 这 是 因为 便 件 多 线程 对 于 进入 流水 线 的 线程 是 否 
属于 独立 的 进程 还 是 同一 个 进程 的 某 个 部 分 是 不 了 解 的 。 

上 述 讨论 引发 了 另 一 个 问题 : 使 用 超标 量 设计 的 处 理 融 的 ILP 能够 与 TLP 共存 吗 ? 答案 
是 可 以 共存 ， 而 这 正 是 大 多 数 现代 处 理 器 用 来 增加 性 能 的 做 法 。 基 本 事实 是 现代 的 多 部 件 处 
理 器 拥有 比 一 个 单独 线程 使 用 更 多 的 功能 单元 。 因 此 ， 使 用 多 部 件 处 理 器 的 ILP 和 使 用 逻辑 
Ab PARE A) TLP 是 一 个 天 衣 无 颖 的 结合 。 

每 个 厂商 给 这 种 融合 了 ILP 和 TLP 的 方法 取 了 不 同 的 名 字 。Intel 的 超 线程 在 多 数 Intel 处 
理 器 上 都 是 其 中 的 一 个 标准 特性 ; IBM 称 其 为 同步 多 线程 (SMT) 并 在 IBM Power5 处 理 器 予 
以 运用 。 

互联 网 络 在 我 们 看 几 种 不 同 的 并 行 架构 前 ， 对 计算 机 系统 中 的 元 素 如 何 进行 内 部 互联 
有 一 个 基础 的 认识 将 会 非常 有 用 。 在 一 个 单 处 理 器 中 ， 我 们 已 经 在 第 4、9 和 10 章 中 学 习 了 
使 处 理 器 、 内 存 以 及 外 部 设备 相互 连接 在 一 起 的 总 线 的 概念 。 并 行 机 如 中 互联 网 络 的 一 个 最 
简单 的 形式 就 是 共享 总 线 ( 见 12.9 节 )。 然 而 ， 大 规模 并 行 机 器 可 能 有 数 千 个 处 理 硕 。 我 们 把 
这 种 并 行 机 器 中 的 每 个 节点 称 为 一 个 处 理 单元 ， 简 称 PE。 共享 总 线 很 可 能 成 为 在 如 此 大 规模 
机 器 上 的 各 个 PE 之 间 通 信 的 瓶颈 。 因 此 ， 大 规模 机 器 需要 使 用 更 复杂 的 互联 网 络 ， 例 如 网 格 
(每 个 处 理 器 与 其 东南 西北 的 4 个 邻居 相连 ) 或 树 。 这 种 复杂 的 互联 网 络 使 得 不 同 PE 之 间 可 
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以 同时 通信 。 图 12-35 是 这 种 复杂 互联 网 络 的 例子 。 每 个 PE 可 能 在 本 地 有 连接 内 存 和 其 他 外 
部 设备 的 总 线 。 
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b) 一 个 环 状 的 互联 网 络 c) 一 个 树 状 的 互联 网 络 
图 12-35 ” 几 种 不 同 的 互联 网 络 





并 行 架构 的 分 类 : 1966 年 ，Flynn 基于 并 发 处 理 的 独立 指令 和 数据 流 数量 ， 提 出 了 一 种 
简单 的 对 所 有 架构 进行 分 类 的 方法 。 这 种 分 类 方法 对 于 理解 设计 空间 和 架构 选择 很 有 帮助 ， 
也 有 助 于 我 们 理解 每 种 架构 风格 最 适合 的 应 用 程序 种 类 。 图 12-36 用 图 示 的 方法 说 明了 这 种 
分 类 方法 。 

单 指令 单数 据 流 (SISD ) : 这 是 最 经 典 的 单 处 理 器 。 一 个 单 处 理 器 上 有 并 行 成 分 吗 ? 我 们 
知道 ， 在 编程 级 ， 单 处 理 器 处 理 一 个 单独 的 指令 流 并 且 顺 序 地 执行 这 些 指令 。 然 而 ， 在 实现 
级 上 ， 单 处 理 器 使 用 指令 集 并 行 (简称 ILP)。ILP 使 流水 化 的 、 超 标量 的 指令 集 架构 实现 成 
为 可 能 ( 见 第 5 章 )。 
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图 12-36 “并 行 架 构 的 分 类 


单 指令 多 数据 流 (SIMD) 所 有 处 理 器 以 锁 步 方式 在 独立 的 数据 流 上 执行 同一 条 指令 。 在 
杀手 级 的 微 处 理 需 (20 世纪 90 年 代 推 出 的 强劲 单 世 片 微 处 理 器 ) 使 这 种 风格 的 架构 在 商业 
上 毫 无 竞争 力 之 前 ， 有 些 机 器 就 是 以 这 种 架构 构建 的 ， 例 如 Thinking Machine Cporation 的 
Connection Machine, CM-1 和 CM-2 ; Maspar MP-1 和 MP-2。 这 种 风格 的 架构 特别 适用 于 图 
像 处 理应 用 〈 比 如 ， 对 图 像 的 每 个 像素 应 用 同一 个 操作 )。 图 12-37 是 一 个 SIMD BL aie HY AY 
结构 。SIMD 机 器 的 每 个 处 理 器 称 为 一 个 处 理 单 元 ( PE)， 并 且 有 自己 的 从 不 同 数 据 源 上 预 载 
的 数据 存储 侨 。 在 控制 单元 中 包含 了 一 个 单独 的 指令 存储 副 ， 取 出 指令 并 将 其 分 发 给 PE 阵 
列 。 指 令 存 储 器 也 预 载 了 需要 在 PE 阵列 上 执行 的 程序 。 每 个 PE 在 来 目 不 同 数据 存储 硕 的 数 
据 流 上 执行 指令 。SIMD 模型 促进 了 非常 细 粒 度 上 的 并 行 度 。 例 如 ， 一 个 for 循环 可 以 并 行 执 
4, 让 每 个 迭代 运行 在 不 同 的 PE 上 。 我 们 把 细 将 度 并 行 定 义 为 在 与 其 他 处 理 需 通信 前 先 在 各 
个 处 理 器 上 执行 一 小 部 分 指令 (比如 说 ,小 于 10 条 )。 | 





图 12-37 SIMD 机 器 的 结构 。 前 端 处 理 器 通常 是 一 个 运行 类 UNIX 操作 系统 的 性 能 强劲 
的 工作 站 。PE 代表 处 理 单元 ， 是 SIMD 机 器 的 基本 构建 模块 


SIMD 机 器 是 用 来 执行 一 些 细 粒 度 计算 密集 型 任务 的 重负 载 机 器 。SIMD 机 器 的 程序 开 
发 通常 都 是 通过 一 个 前 端 处 理 器 (一 台 工 作 站 级 别 的 机 器 ) 完成 的 。 前 端 还 负责 预 加 载 PE 中 
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的 数据 存储 器 和 阵列 控制 单元 的 指令 存储 。 所 有 VO 也 是 通过 前 端 处 理 器 协调 执行 的 。PE 之 
则 通过 互联 网 络 通信 。 由 于 SIMD 机 器 有 数 千 台 处 理 器 ， 所 以 它们 使 用 前 面 提 到 的 较为 复杂 
的 互连网 络 (例如 ， 网 格 或 者 树 状 结构 )。 尽 管 目前 市 场 上 没有 这 种 类 型 的 商业 机 器 ， 但 Intel 
MMX 指令 就 受到 了 这 种 架构 风格 利用 的 并 行 机 制 的 启发 。 这 种 风格 的 计算 最 近 出 现 了 一 定 
程度 的 复兴 ， 典 型 的 有 nVidia 图 形 卡 〈 或 称 为 图 形 处 理 单 元 ， 简 称 为 GPU ) 这 样 的 流 加 速 器 。 
随 着 面向 流 的 处 理 (音频 、 视 频 等 ) 变 得 越 来 越 常见 ， 传 统 的 处 理 需 架构 和 流 加 速 器 正在 融 
Ao ili, Intel 的 Larrabee 通用 图 形 处 理 器 (GPGPU) 架构 代表 了 这 样 的 一 种 集成 架构 ， 它 
们 为 未 来 的 超级 计算 机 提供 了 良好 的 平台 。 

多 指令 单数 据 流 (MISD) 在 算法 级 ， 我 们 可 以 看 到 这 种 架构 风格 的 运用 。 假 设 我 们 要 在 
同一 个 图 像 流 上 运行 多 个 不 同 的 脸 部 识别 算法 ， 每 个 算法 代表 了 一 个 不 同 工 作 在 同一 个 数据 
流 ( 即 图 像 流 ) 上 的 指令 流 。MISD 是 并 行 架构 中 的 一 种 类 别 ， 但 是 这 种 风格 的 架构 并 没有 什 
么 迷人 之 处 。 目 前 大 多 数 计算 还 是 喜欢 使 用 MIMD 或 者 SIMD 架构 。 因 此 ， 没 有 哪个 架构 完 
全 匹配 这 种 计算 风格 。 脉 动 阵列 9 也 许可 以 算 作 某 种 形式 的 MISD 架构 。 脉 动 阵列 的 每 个 单元 
工作 在 数据 流 上 并 将 转化 的 数据 传递 给 阵列 中 的 下 一 个 单元 。 尽 管 这 只 是 一 个 设计 草图 , 但 
如 果 把 每 个 指令 看 作 “ 数 据 ” 和 指令 从 一 个 阶段 到 下 一 个 阶段 移动 的 状况 ， 那 么 就 可 以 把 它 
当做 一 种 粒度 非常 细 的 代表 MISD 风格 的 指令 处 理 流水 线 。 

多 指令 多 数据 流 (MMD) 这 是 最 通用 的 架构 风格 ,而 且 大 多 数 现代 的 并 行 架构 都 是 这 
种 风格 。 每 个 处 理 右 有 自己 的 指令 流 和 数据 流 ， 相 互 之 间 异 步 地 工作 。 处 理 器 自身 可 以 是 现 
有 的 处 理 器 。 在 每 个 处 理 器 上 运行 的 程序 可 以 是 完全 独立 的 ， 或 者 是 某 个 复杂 应 用 程序 的 一 
部 分 。 如 果 程 序 是 后 者 ， 那 么 由 于 这 种 架构 模型 的 内 在 异步 性 ， 在 不 同 处 理 器 上 执行 的 同一 
个 应 用 程序 的 线程 之 间 需 要 进行 同步 。 这 种 架构 风格 最 适合 文 持 显 示 出 中 等 到 较 粗 粒度 并 行 
性 的 应 用 程序 。 所 谓 中 等 粒度 并 行 度 是 指 在 与 其 他 处 理 需 通信 前 大 约 执行 10 ~ 100 条 指令 的 
程序 ; 粗 粒 度 并 行 度 则 是 指 在 处 理 需 进行 通信 和 前 执行 几 千 条 指令 的 情况 。 

早期 的 多 处 理 器 都 是 SIMD 风格 的 。 因 此 ， 对 SIMD 机 器 的 每 个 处 理 器 都 需要 进行 针 
对 机 器 做 特别 的 设计 。 这 在 通用 处 理 器 通过 分 立 电 路 组 装 的 时 代 是 没有 问题 的 。 然 而 ， 我 
们 已 经 说 过 ， 杀 手 级 微 处 理 器 的 到 来 使 得 个 性 化 构建 的 处 理 器 在 市 场 中 越 来 越 难以 生存 。 
另 一 方面 ，MIMD 机 器 中 的 基本 构建 是 通用 处 理 器 。 因 此 ， 这 种 架构 可 以 非常 好 地 得 益 于 
现成 商业 处 理 器 技术 上 的 进步 。 而 且 ， 这 种 架构 风格 的 并 行 机 器 可 以 运行 多 个 独立 的 顺序 
应 用 程序 ， 也 可 以 运行 一 个 并 行程 序 的 多 个 线程 ， 还 可 以 组 合 地 运行 上 述 的 两 类 程序 。 应 
当 注 意 ， 随 着 流 加 速 器 的 到 来 (例如 ，nVidia GeForce 系列 的 GPU )， 混 合 的 并 行 机 器 模型 
正在 形成 。 

消息 传递 与 共享 地 址 空间 的 多 处 理 器 MIMD 机 器 可 以 分 成 两 大 类 : 消息 传递 型 和 共享 
地 址 空间 型 。 图 12-38 是 消息 传递 型 多 处 理 器 的 图 示 。 每 个 处 理 器 有 自己 私有 的 内 存 ， 进 程 
之 间 通 过 互联 网 络 上 的 消息 发 送 进行 通信 。 处 理 器 之 间 没 有 共享 的 内 存 。 因 为 这 个 原因 ， 这 
种 架构 也 称 作 分 布 式 内 存 的 多 处 理 需 。 

IBM 的 Bluegene 系列 是 符合 该 模型 的 当代 消息 传递 型 机 器 。 过 去 的 消息 传递 型 机 天 包 括 
T TMC 的 CM-5、Intel Paragon, IBM SP-2。 上 一 代 的 并 行 机 器 依赖 于 特殊 的 互联 网 络 技术 
来 提供 处 理 器 之 间 的 低 延 迟 通信 。 然 而 ， 随 着 计算 机 网 络 的 进步 ( 见 第 13 章 )， 局 域 网 技术 提 


© +h Kung 和 Leiserson 在 脉动 阵列 方面 发 表 的 文章 [Kung, 1979] 是 该 领域 的 开创 性 工作 。 
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供 了 在 消息 传递 型 多 计算 机 系统 中 的 低 延 迟 高 带宽 通信 。 因 此 ， 一 个 集群 并 行 机 器 ， 即 使 用 
吉 比 特 以 太 网 ( 见 13.8 节 ) 的 局 域 网 进行 内 部 互联 的 一 组 计算 机 ， 已 经 成 了 并 行 计 算 十 分 流 
行 的 一 种 平台 。 就 像 pthread 库 提 供 了 在 共享 内 存 环境 下 进行 并 行 计算 的 工具 ， 消 息 传 递 接口 
(MPI) 是 消息 传递 计算 环境 中 的 编程 库 。 


CPU CPU CPU CPU 
+ = + + 
缓存 缓存 缓存 缓存 


| itt Hio | 内 存 Hi | 内 存 {6] | 内 存 Us 


图 12-38 ”消息 传递 型 多 处 理 需 


共享 地 址 空间 型 多 处 理 器 是 MIMD 机 需 的 第 二 个 类 别 ， 顾 名 思 义 ， 它 提供 了 内 存单 元 的 
等 效 性 ， 即 不 考虑 是 哪个 处 理 器 访问 该 单元 。 换 言 之 ,一 个 给 定 的 内 存 地 址 (例如 ，0x2000 ) 
在 无 论 哪个 处 理 器 中 指 的 都 是 同一 个 内 存单 元 。 我 们 知道 ， 一 个 处 理 器 有 多 级 缓存 。 自 然 地 ， 
当 访 问 内 存单 元 时 ， 单 元 中 的 数据 将 传人 处 理 器 缓存 中 。 在 12.9 节 中 ， 我 们 知道 这 会 带 来 多 
处 理 器 中 的 缓存 一 致 性 问题 。 共 享 地 址 空间 的 机 顺 可 以 进一步 分 成 两 大 类 ， 根 据 缓存 一 致 性 
问题 是 在 硬件 还 是 软件 中 处 理 。 非 缓存 一 致 的 (NCC) 多 处 理 器 提供 了 共享 的 地 址 空间 ， 但 在 
硬件 上 并 无 缓存 一 致 性 。 这 种 机 器 包括 以 前 的 BBN Butterfly, Cray T3D 和 Cray T3E 等 。 最 
近 的 一 个 例子 是 Cray XDI. 

缓存 一 致 的 ( CC) 多 处 理 器 提供 了 共享 的 地 址 空间 ， 也 提供 了 硬件 上 的 缓存 一 致 性 。 这 
种 类 型 的 机 器 包括 以 前 的 包括 KSR-1. Sequent Symmetry 和 SGI Origin 2000。 现 代 的 这 种 机 
器 包括 SGI Altix。 而 且 ， 任 何 高 性 能 集群 系统 (例如 ，IBM Bluegene) 的 独立 节点 通常 都 是 
缓存 一 致 的 多 处 理 需 。 

在 12.9 节 中 ,我们 向 读者 介绍 了 基于 总 线 的 共享 内 存 多 处 理 器 。 大 规模 并 行 机 器 (无论 
它 是 消息 传递 型 的 还 是 共享 地 址 空间 型 的 机 器 ) 都 需要 比 总 线 更 复杂 的 互联 网 络 。 提 供 了 共 
享 地 址 空间 的 大 规模 并 行 机 需 通 常 称 为 分 布 式 共享 内 存 (DSM) 的 机 需 ， 因 为 物理 内 存 是 分 
布 式 的 并 且 与 每 个 单独 的 处 理 咒 相关 联 。 

我 们 在 12.9 节 中 讨论 的 缓存 一 致 性 机 制 使 用 了 广播 媒介 ， 即 一 条 共享 总 线 ， 因 此 使 得 对 
we EAI 
状 、 环 状 或 者 网 格 COLA 12-35 )， 它 就 不 再 是 广播 媒介 了 。 通 信和 是 点 到 点 的 。 因 此 ， 需 要 一 
些 其 他 的 机 制 来 实现 缓存 一 致 性 。 这 种 大 规模 共享 内 存 的 多 处 理 器 使 用 一 种 基于 目录 的 方案 
来 实现 缓存 一 致 性 。 想 法 非常 简单 。 共 享 内存 是 物理 上 分 散 的 ， 将 共享 内 存 的 每 一 块 与 一 个 
目录 关联 起 来 。 每 个 内 存单 元 有 一 个 目录 项 与 之 相对 应 。 这 个 项 包含 了 当前 缓存 了 该 内 存单 
元 的 处 理 器 。 绥 存 一 致 性 算法 可 以 是 基于 无 效 化 或 者 基于 更 新 的 。 目 录 保 存 了 这 些 统计 信息 ， 
用 于 发 送 无 效 化 或 更 新 信息 。 

图 12-39 是 基于 目录 的 DSM 的 一 个 结构 图 。 单 元 当前 被 P2、P3、P4 缓存 。 如 果 P4 
希望 向 单元 和 写 人 ， 在 P4 被 允许 进行 实际 写 入 操作 前 ， 与 单元 站 相关 联 的 目录 会 向 P2 和 P3 
发 送 一 个 无 效 化 信息 。 总 之 ， 分布 式 目录 完成 来 自 不 同 处 理 右 的 内 存 访问 请 求 ， 确 保 对 这 些 
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的 顺序 处 理 内 存 访问 请 求 ， 从 而 保证 返回 给 处 理 器 的 数据 值 的 一 致 性 。 
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图 12-39 上 有 具有 基于 目录 致 性 的 DSM 多 处 理 需 


在 一 个 与 图 12-39 类 似 的 4 处 理 器 DSM 上 ， 内 存单 元 了 在 3 的 物理 内 存 上 。 当 前 ，P1、 
P2 和 了 P4 在 各 自 的 缓存 中 有 了 的 拷贝 。 了 的 当前 值 是 101。P1 希望 将 了 改写 为 108。 说 出 在 了 被 改写 为 
108 前 发 生 的 一 系列 步骤 。 假 设 缓存 的 写 策略 是 回 写 。 

e 


a 由 于 内 存单 元 了 在 P3 中 ， 所 以 Pl 通过 互联 网 络 向 P3 发 送 一 个 请 求 并 为 了 申请 写 权 限 〈 见 
图 12-40a ) 。 

b. P3 通过 查找 了 的 目录 项 发 现 ，P2 和 了 P4 在 各 自 缓存 中 有 了 的 拷贝 ， 因 此 向 P2 和 了 P4 发送 将 了 无 
效 化 的 请 求 ( 见 图 12-40b ) 。 

c. P2 和 了 P4 将 各 自 缓存 中 的 了 无 效 化 并 通过 互联 网 络 向 P3 发 回 确认 信息 。P3 从 了 的 目录 项 中 移 除 
P2 和 P4 ( 见 图 12-40c)。 

d. P3 向 Pl 发 送 写 许可 ( 见 图 12-40d), 

e. P1 向 了 的 缓存 项 中 写 入 108 ( 见 图 12-40e)。 
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图 12-40 fol] 12-18 的 各 个 步骤 


内 存 一 致 性 模型 与 缓存 一 致 性 : RA E Aa H NARE (REMARKA 
存 了 ) 被 修改 了 ， 这 个 值 会 被 传递 到 所 有 缓存 的 拷贝 和 内 存 上 。 我 们 可 以 期 望 在 所 有 缓存 的 
拷贝 更 新 了 这 个 新 值 前 会 有 一 段 延迟 。 这 就 提出 了 一 个 问题 ， 从 程序 角度 看 会 是 怎么 样 的 
WE? 内 存 一 致 性 模型 就 是 为 了 在 程序 员 和 存储 系统 之 间 定 义 这 个 视角 而 产生 的 。 我 们 在 本 书 
中 不 停 地 看 到 系统 设计 就 是 关于 在 硬件 和 软件 之 间 建 立 契 约 。 例 如 ，ISA 是 编译 上 硕 编 写 者 和 
处 理 器 架构 师 之 间 的 契约 。 一 旦 ISA 设置 好 了 ， 甚 实现 就 可 以 在 ISA 的 硬件 实现 里 使 用 他 的 
选择 。 内 存 一 致 性 模型 是 一 个 类 似 的 程序 员 和 存储 系统 架构 师 之 间 的 契约 。 
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我 们 用 一 个 例子 来 说 明 。 下 面 给 出 的 是 SMP 的 处 理 器 Pl 和 P2 的 一 段 执行 记录 。 内 存 是 
共享 的 ， 但 是 处 理 器 寄存 器 是 私有 的 。 


Mem[X] = 0 

处 理 器 Pl 处 理 器 P2 
Time 0: Rl © 1 
Time 1: Mem[X] < Rl R2 < 0 
Time 2: oe @ Se F oe &S 
Time 3: iw Ss R2 < Mem[X] 
Time 4: Gt 


在 时 间 4 P2 上 R2 的 值 会 是 什么 呢 ? 直觉 的 答案 是 1。 然 而 ， 这 真 的 取决 于 存储 系统 的 实 
现 。 我 们 假设 上 述 执行 过 程 中 的 每 条 指令 对 于 该 处 理 器 都 是 原子 的 。 因 此 ， 在 时 间 1， 处 理 
at P1 向 Mem[X] 写 和信 了 值 1。 这 意味 着 ， 只 要 P1 参与 ， 在 时 间 1 后 Pl 读 取 Mem[X] AT, 存 
储 系统 会 保证 它 得 到 的 值 是 1。 然 而， 当 其 他 处 理 需 访问 相同 内 存单 元 的 值 时 ， 存 储 系统 关 
于 得 到 的 值 能 做 出 什么 保证 呢 ? 如 果 在 时 间 3 时 ，P2 访问 得 到 的 返回 值 有 可 能 是 0 吗 ? 缓存 
一 致 性 机 制 保证 在 P1 和 了 P2 的 缓存 和 内 存 上 ， 在 Mem[X] 存储 的 值 最 终 都 会 变 为 1。 但 是 它 
并 不 能 指定 什么 时 候 这 些 值 会 变 成 一 致 的 。 而 内 存 一 致 性 模型 回答 了 这 个 什么 时 候 的 问题 。 

一 个 直观 的 由 Leslie Lamport 提出 的 内 存 一 致 性 模型 称 为 顺序 一 致 性 (SC)。 在 这 个 模型 
中 ， 内 存 读 / 写 对 于 整体 系统 而 言 是 原子 的 。 因 此 ， 如 果 P1 在 时 间 1 加 Mem[X] SA, JB 
么 内 存 该 位 置 的 新 值 在 这 之 后 对 所 有 处 理 器 都 是 可 见 的 。 所 以 ， 当 P2 在 时 间 3 读 取 Mem[X] 
时 ， 存 储 系 统 保证 它 读 取 到 的 值 是 1。 就 程序 员 关 心 的 内 容 而 言 ， 这 就 是 所 有 关于 存储 系统 
中 他 在 编写 正确 程序 时 需要 了 解 的 细节 。 带 有 缓存 的 存储 系统 的 实现 与 缓存 一 致 性 机 制 的 细 
节 对 程序 员 而 言 都 是 无 关 紧 要 的 。 这 与 我 们 在 处 理 占 ISA 设计 中 看 到 的 架构 与 实现 的 分 离 是 

我 们 给 出 SC 内 存 模型 一 个 更 精确 的 定义 。 来 自 某 个 处 理 器 的 内 存 访问 的 效果 与 没有 其 他 
处 理 咒 访问 内 存 时 的 效果 是 一 样 的 。 即 ， 每 个 内 存 访 问 ( 读 或 写 ) 是 原子 的 。 单 处 理 句 是 这 样 ”[608] 
的 ， 因 此 很 自然 希望 多 处 理 需 也 是 一 样 的 。 对 于 来 自 不 同 处理 占 的 内 存 访 问 ， 最 终 的 效果 将 
是 来 自 不 同 处理 需 的 独立 原子 的 内 存 访 问 的 任意 交叉 组 合 。 

一 种 可 视 化 SC 内 存 模型 的 方式 是 把 来 自 不 同 处 理 器 的 内 存 访问 看 成 卡 牌 游戏 中 一 群 玩 家 
需要 处 理 的 牌 。 你 可 能 看 过 下 图 中 的 情景 ， 玩 牌 老手 将 两 摊牌 通过 洗 牌 后 合并 在 一 起 ， 并 保 
持 每 一 摆 中 的 牌 还 是 保持 原来 的 顺序 。SC 内 存 模型 相当 于 对 来 目 个 处 理 副 的 内 存 访问 进行 
了 一 个 n 路 的 洗 牌 合并 。 





回 到 前 面 的 例子 ，P2 对 Mem[X] 的 访问 发 生 在 Pl 对 Mem[X] 的 访问 之 后 。 处 理 促 之 间 
是 异步 的 。 因 此 ， 另 一 个 相同 的 程序 在 执行 时 这 两 个 访问 的 顺序 可 能 就 会 正好 反 过 来 。 这 种 
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情况 下 ，P2 对 Mem[X] 的 访问 会 得 到 0 的 结果 。 换 言 之 ， 对 于 前 面 的 那个 程序 ，SC 模型 会 
让 存储 系统 给 P2 对 Mem[X] 的 访问 返回 0 或 者 1。 

我 们 可 以 看 到 SC 内 存 模型 可 能 导致 并 行程 序 中 的 数据 竞争 ( 见 12.2.3 节 关 于 数据 竞争 的 
摘 述 )。 兴 和 运 的 是 ， 这 并 不 影响 正确 的 并 行程 序 开 发 ， 只 要 程序 员 使 用 前 面 讨 论 的 同步 机 制 来 
协调 应 用 程序 中 线程 之 间 的 活动 。 事 实 上， 就 像 我 们 在 前 几 节 中 看 到 的 ， 程 序 员 完 全 不 需要 
知道 内 存 一 致 性 模型 ， 因 为 他 是 用 诸如 pthread 这 样 的 库 进行 开发 的 。 就 像 ISA 是 编译 器 编写 
者 和 架构 师 之 间 的 契约 ， 内 存 一 致 性 模型 可 以 看 做 库 的 编写 者 和 系统 架构 师 之 间 的 契约 。 

SC 内 存 模 型 对 处 理 需 如 何 使 用 同步 原 语 来 协调 它们 的 活动 没有 涉及 。 我 们 在 前 几 节 说 
过 ， 系 统 可 能 会 为 了 协调 线程 之 间 的 活动 而 在 硬件 或 软件 上 提供 同步 原 语 。 因 此 ， 可 能 包括 
了 这 样 的 一 种 同步 原 语 ， 它 与 正 第 的 内 存 访问 一 起 来 指定 硬件 和 软件 之 间 的 契约 。 这 给 系统 
架构 师 在 优化 存储 系统 性 能 时 提供 更 多 的 实现 选择 。 面 向 共享 内 存 系统 的 内 存 一 致 性 模型 是 
20 世纪 80 年 代 末 期 到 90 年 代 初 期 的 一 个 热门 研究 领域 ， 那 段 时 间 内 涌现 了 不 少 相 关 的 博士 
论文 。 这 方面 话题 的 更 多 细节 超出 了 本 书 的 讨论 范围 (我 们 在 本 章 结 尾 提 供 了 建议 的 扩展 阅 
该 材料 ) 。 


12.10.3 ”未 来 之 路 : 多 核 与 众 核 架构 


并 行 计算 的 未 来 之 路 令 人 回 往 。 新 世纪 已 经 是 多 核 处 理 右 的 时 代 了 。 多 核 (multicore) 的 
名 称 来 自 于 一 个 简单 的 事实 ， 即 芯片 由 多 个 独立 时 钟 控 制 的 处 理 需 核 构 成 。Moore 定律 预言 
必 片 密度 随 着 时 间 的 增长 速度 。 到 目前 为 止 ， 这 种 在 必 片 密度 的 增长 已 经 被 充分 利用 来 增加 
处 理 器 性 能 。 有 些 现 代 处 理 器 ,包括 AMD Phenom II, IBM PowerS, Intel Pentium D, Xeon- 
MP 以 及 Sun T1 都 使 用 了 多 核 技术 。 

然而 ， 随 着 处 理 需 性 能 的 增长 ， 单 芯片 处 理 硕 的 能 耗 也 在 稳定 增加 ( 见 5.15.5 节 )。 能 耗 
与 处 理 器 的 时 钟 频 率 成 正比 。 这 个 趋势 迫使 处 理 需 架构 师 在 增加 芯片 密度 的 同时 把 注意 力 集 
中 到 了 降低 能 耗 上 。 答 案 是 在 一 块 单独 的 芯片 上 放置 多 个 处 理 器 核 ， 每 个 以 较 低 的 时 钟 频率 
运转 。 保 持 能 耗 的 基本 策略 就 是 选择 性 地 将 芯片 的 一 部 分 关 掉 。 换 言 之 ， 基 于 能 耗 上 的 考虑 
让 我 们 不 得 不 放弃 更 快 的 单 处 理 需 转 而 选择 更 高 的 并 行 度 。 通 过 目前 包含 了 多 个 独立 处 理 需 
核 的 单 芯片 处 理 器 ， 并 行 计 算 不 再 只 是 一 个 选项 ， 而 是 我 们 为 了 发 展 必 须 前 进 的 方向 。 而 单 
芯片 处 理 器 发 展 的 下 一 步 则 是 众 核 (many core) 处 理 需 ， 即 在 一 块 必 片 上 包含 成 百 甚 至 上 后 
个 核 。 每 个 这 种 处 理 需 核 很 可 能 是 一 个 非常 简单 的 处 理 器 ， 与 我 们 在 第 5 章 中 提 到 的 基本 的 
流水 线 处 理 器 可 能 并 无 很 大 区 别 。 所 以 ， 即 使 在 前 面 章节 中 我 们 没有 深入 探讨 现代 处 理 融 微 
架构 的 复杂 之 处 ,我们 提 到 的 简单 实现 可 能 也 会 与 未 来 众 核 处 理 强 奶奶 相 关 。 

我 们 也 许 会 这 么 想 : 多 核 架 构 与 封装 到 一 个 单独 芯片 里 的 SMP 没有 什么 区 别 。 而 众 核 架 
构 ， 就 是 类 似 的 一 个 拥有 成 百 上 千 个 PE 的 大 规模 多 处 理 器 的 封装 版 。 然 而 ， 这 并 不 是 平常 的 . 
生意 ， 尤 其 考虑 到 需要 彻底 重新 思考 的 问题 ， 其 范围 包括 了 系统 级 的 电气 工程 、 编 程 范式 和 
资源 管理 。 

在 电气 工程 级 ， 我 们 已 经 提 到 了 减少 能 量 浪 费 的 需求 。 保 持 能 耗 是 一 件 涉及 实际 的 事情 。 
很 显然 ， 对 一 个 体积 比 1 美 分 还 小 、 能 耗 却 达 到 数 百 瓦 的 处 理 器 进行 降温 是 一 件 不 可 能 完成 
的 事情 。 男 一 个 需要 关心 的 事情 是 电信 号 的 分 布 问 题 ， 尤 其 是 芯片 上 的 时 钟 。 通 常 ， 我 们 会 
觉得 在 线 上 放置 1 或 0 就 可 以 将 这 个 信和 号 传输 给 接收 者 。 在 有 足够 时 间 ， 即 线路 延迟 (信号 
在 线路 上 传输 给 接收 者 的 时 间 )， 够 长 的 情况 下 这 是 一 个 安全 的 假设 。 我 们 在 第 3 章 中 看 到 ， 
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线路 延迟 是 电线 上 的 电阻 和 电容 的 函数 。 当 时 钟 速度 增加 后 ,线路 延迟 可 能 会 接近 时 钟 周期 
的 时 间 ， 导致 心 片 内 的 线路 变 成 一 根 根 传输 线 ， 导 致 信号 强度 随 距 离 而 衰减 。 因 此 ， 随 着 在 
多 核 和 众 核 时 代 世 片 密度 的 增加 ， 芯 片 设计 者 不 得 不 重新 评估 关于 数字 信和 号 的 一 些 基本 假设 。 
这 就 导致 在 集成 电路 CIC) 设计 上 出 现 了 新 趋势 ， 即 所 谓 的 三 维 设计 ， 也 称 3D IC。 简 单 地 
说 ， 为 了 减少 线路 长 度 ， 芯片 被 设计 成 在 z 维 的 多 个 平行 面 上 包含 有 源 器 件 (导体 ) 的 形式 。 
因此 ， 到 目前 为 止 ， 只 是 局 限 在 二 维 上 的 线路 将 以 三 维 空间 的 形式 进行 布局 ， 从 而 减少 有 源 
需 件 之 间 的 线路 延迟 。 开 发 3D 芯片 与 建造 摩天 大 楼 有 些 类 似 。 主 流 的 通用 处 理 器 将 包含 这 
种 技术 ， 其 成 为 主流 只 是 时 间 问 题 。 

在 架构 级 ，SMP 和 多 核 处 理 器 之 间 有 几 个 区 别 。 在 SMP 的 硬件 级 ， 仅 有 的 硬件 共享 资源 
是 总 线 。 为 一 方面 ， 在 一 个 多 核 处 理 带 中 ， 其 中 的 一 些 人 硬件 资源 对 所 有 核 都 是 共享 的 。 例 如 ， 
我 们 在 第 9 章 展 示 了 AMD Barcelona 心 片 的 多 级 存储 体系 ( 见 图 9-45 )。 芯 片上 的 3 缓存 被 
世 片 上 的 4 个 核 共 享 。 还 有 其 他 可 被 共享 的 资源 ， 例 如 从 芯片 出 来 的 IO 以 及 存储 总 线 。 有 
效 地 调度 使 用 好 这 些 共 享 资源 是 一 个 架构 需要 考虑 的 问题 。 

在 编程 级 ， 在 多 核 上 运行 并 行程 序 与 在 SMP 上 有 几 个 很 重要 的 区 别 。 一 种 设计 并 行程 序 
的 好 方法 是 确保 在 计算 和 通信 之 间 有 很 好 的 平衡 。 在 SMP 上 ， 线 程 在 需要 与 运行 于 其 他 处 
理 器 上 的 线程 进行 通信 前 先 分配 一 定数 量 的 工作 。 也 就 是 说 ， 计 算 需 要 是 粗 粒 度 的 ， 从 而 抵 
消 处 理 需 之 间 的 通信 开销 。 由 于 一 个 多 核 处 理 器 中 各 个 PE 之 间 的 邻近 关系 ， 可 能 获得 与 在 
SMP EREE E eR EMIT E 

在 操作 系统 级 ，SMP 和 多 核 处 理 融 之 间 有 根本 性 的 区 别 。 在 多 核 处 理 器 上 调度 多 线程 程 
序 的 各 个 线程 与 SMP 相 比 需要 重新 考虑 更 充分 地 利用 核 与 核 之 间 共 享 的 硬件 资源 。 在 SMP 
上 ， 每 个 处 理 器 有 独立 的 操作 系统 的 镜像 。 在 多 核 处 理 右 上 ， 核 的 优势 是 可 以 共享 同一 个 操 
作 系 统 的 镜像 。 操 作 系 统 设计 者 需要 重新 思考 怎样 的 操作 系统 数据 结构 可 以 在 核 之 间 共 享 ， 
以 及 哪些 需要 保持 独立 。 

众 核 处 理 器 则 可 能 在 所 有 这 些 级 上 产生 一 整套 新 问题 ， 并 加 上 一 些 诸如 应 对 局 部 软 / 硬 
件 故 障 等 的 新 间 题 。 


小 结 


在 本 章 中 ， 我 们 讲述 的 内 容 覆 盖 了 使 用 线程 进行 并 行程 序 设 计 的 核心 概念 ， 操 作 系 统 对 
线程 的 支持 ,以 及 有 关 线 程 架 构 的 辅助 功能 。 我 们 也 回顾 了 操作 系统 和 并 行 染 构 方 面 的 一 些 
高 级 话题 。 

应 用 程序 在 编写 多 线程 的 并 行程 序 时 需要 关心 的 3 件 事情 是 线程 的 创建 /终止 、 线 程 之 
间 的 数据 共享 ， 以 及 线程 之 间 的 同步 。12.3 节 给 出 了 线程 函数 调用 的 一 个 总 结 ， 表 12-2 给 出 
了 读者 在 开发 多 线程 程序 时 需要 熟悉 的 几 个 词汇 。12.6 节 给 出 了 pthread 库 所 支持 的 一 些 重要 
的 线程 API 调用 的 总 结 。 

在 讨论 线程 的 实现 时 ， 我 们 讨论 了 在 操作 系统 之 上 实现 线程 的 可 能 性 ， 即 用 户 级 库 ， 它 
所 需要 的 操作 系统 的 支持 是 最 少 的 。 大 多 数 现代 操作 系统 ， 例 如 Linux, Microsoft XP 和 
Vista， 都 支持 把 线程 作为 CPU 调度 的 基本 单元 。 在 这 种 情况 下 ， 操 作 系统 在 编程 级 实现 了 所 
需 的 功能 。 我 们 在 12.7.2 节 中 介绍 了 内 核 级 线程 ， 并 在 12.7.3 节 中 以 Sun Solaris 操作 系统 为 
例 介 绍 了 其 如 何 管理 线程 。 

线程 所 需要 的 基础 架构 上 的 辅助 功能 是 一 个 原子 的 读 取 -修改 - 写 人 内 存 操作 。 我 们 在 
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12.8 市 介绍 了 test-and-set 指令 ， 并 说 明了 如 何 通 过 使 用 该 指令 来 实现 操作 系统 中 更 高 层次 的 
同步 支持 。12.9 节 提 到 ， 为 了 支持 处 理 器 之 间 的 数据 共享 ， 需 要 解决 缓存 一 致 性 的 问题 。 

在 12.10 市 中 ,我 们 介绍 了 与 多 处 理 器 有 关 的 操作 系统 和 架构 方面 的 高 级 话题 。 特 别 地 ， 
我 们 向 读者 介绍 了 死 锁 的 形式 化 处 理 方法 、 复 杂 的 同步 概念 (例如 ， 管 程 )、 高 级 同步 技术 ， 
以 及 与 并 发 和 同步 有 关 的 经 典 问 题 ( 见 12.10.1 节 )。 在 12.10.2 节 中 ， 我们 介绍 了 并 行 结构 的 
分 类 (SISD .SIMD 、MISD 和 MIMD )， 并 深入 地 讲述 了 消息 传递 型 和 共享 内 存 型 MIMD 架构 。 

与 多 处 理 器 和 多 线程 程序 相关 的 软 /硬件 问题 是 迷人 而 深 答 的。 我 们 向 读者 介绍 了 该 领域 
中 的 一 些 令 人 兴奋 的 话题 。 然 而 ， 在 本 章 中 ， 我们 仅仅 是 接触 了 这 些 问题 的 表面 。 我 们 希望 能 
够 激发 读者 的 好 奇 心 ， 并 在 更 高 级 的 课程 上 对 这 些 问 题 进行 更 深入 的 研究 。 本 章 涉 及 的 一 些 话 
题 的 更 深入 的 探讨 可 以 参考 并 行 系统 方面 的 高 级 课本 ,例如 [Almasi, 1993; Culler, 1999] 


历史 回顾 


自 计算 机 科学 发 展 早期 并 行 计算 和 多 处 理 右 就 一 直 是 计算 机 科学 家 和 电气 工程 师 的 人 研究 
焦点 。 

在 第 5 章 中 ， 我 们 了 解 了 流水 线 处 理 器 设计 利用 了 指令 级 并 行 (LP), W, ZAHAR 

612) 利用 了 一 种 不 同 的 并 行 性 ， 即 线程 级 并 行 (TLP)。 利 用 ILP 并 不 需要 终端 用 户 做 些 什么 不 同 
的 事 ， 用 户 继 续 写 顺序 程序 即 可 。 编 译 器 ， 与 架构 师 一 起 ， 就 可 以 魔法 般 地 在 顺序 程序 中 利 
用 ILP。 然 而 ，TLP 的 利用 需要 做 更 多 的 工作 。 要 么 我 们 把 程序 写成 使 用 多 线程 的 显 式 并 行 
程序 (如 本 章 中 的 一 些 例子 )， 要 么 就 需要 把 一 个 顺序 程序 自动 转换 成 一 个 多 线程 的 并 行程 序 。 
对 于 后 一 种 方式 ， 需 要 对 顺序 程序 设计 语言 (例如 ，Fortran) 进行 扩展 ， 通 过 程序 插入 的 指示 
符 来 进行 自动 的 并 行 化 。 编 译 器 利用 这 些 指 示 符 对 原始 的 顺序 程序 进行 并 行 化 。 这 种 方式 在 
并 行 计算 发 展 早期 十 分 流行 ,但 是 最 终 用 得 越 来 越 少 ， 因 为 其 应 用 性 被 限制 到 只 能 利用 循环 
级 并 行 ， 对 函数 级 并 行 却 有 些 无 能 为 力 。 而 循环 级 并 行 是 通过 发 现 程序 中 “for” 循 环 的 各 次 
迭代 相互 独立 ， 从 而 把 每 个 迭代 或 一 组 迭代 转变 成 一 个 并 行 的 线程 。 肾 数 级 并 行 ， 或 称 任务 
级 并 行 ， 则 可 以 处 理 程序 认为 可 以 并 行 处 理 的 工作 (与 本 章 用 来 说 明 线 程 编程 概念 的 视频 监 
控 例子 有 些 类 似 )。 

我 们 可 以 轻易 地 知道 利用 并 行 资源 来 完成 更 多 工作 的 吸引 力 。 如 果 一 个 应 用 程序 能 够 获 
得 一 个 给 定 的 单 处 理 器 的 性 能 ， 那 么 理论 上 ， 并 行 化 之 后 可 以 在 性 能 上 再 提高 N 信 。 然 而 ， 
根据 我 们 在 第 5 章 中 了 解 到 的 Amadahl 定律 ， 程 序 中 潜在 的 串 行 部 分 限制 了 这 种 性 能 上 的 
线性 增长 ( 见 练习 16 )。 而 且 ， 在 单 处 理 器 和 并 行 机 器 上 组 成 的 独立 处 理 需 之 间 人 存在 性 能 涉 
后 。 这 是 因为 构建 一 个 并 行 机 器 并 不 是 简单 地 当 有 更 快 处理 器 后 直接 把 现 有 的 奉 换 掉 就 完事 。 
Moore 定律 ( 见 3.1 节 ) 使 得 在 过 去 的 30 年 里 ， 单 处 理 喜 的 性 能 在 持续 不 断 地 增长 。 因 此 ， 
当下 一 代 更 高 性 能 的 微 处 理 器 上 市 后 并 行 机 器 也 很 快 地 过 时 了 。 例 如 ， 一 个 现在 只 需 花 费 几 
千 美元 的 笔记 本 电脑 的 性 能 比 20 世纪 70 年 代 到 80 年 代 耗 资 数 百 万 美元 的 Cray Blak SE R o 
时 效 性 是 并 行 机 器 的 软件 并 没有 像 单 处 理 器 的 软件 发 展 那么 快 的 一 个 主要 原因 。 

并 行 架构 曾经 是 为 需要 高 性 能 应 用 程序 而 保留 的 高 端 市 场 ， 主 要 来 自 科 学 和 工程 领域 。 
主要 的 公司 和 它们 推出 的 并 行 机 器 包括 了 TMC (并 行 机 器 的 连接 机 系列 ， 从 CM-1 发 展 到 
CM-5 )、Mapsar ( MP-1 和 MP-2 ), Sequent (Symmetry )、BBN ( Butterfly ), Kendall Square 
Research ( KSR-1 和 KSR-2 )、SGI ( Origin 系列 以 及 现在 的 Altix)、IBM (SP 系列 )。 这 些 

机 器 的 典型 特征 包括 使 用 现成 的 处 理 器 (例如 ，TMC 的 CM-5 使 用 了 Sun SPARC, SGI 的 
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Origin 系列 使 用 了 MIPS) AEH A co ee all Ah a (例如 ，KSR-1、CM-1、CM-2、MP-l 
和 MP-2 ) ; 一 个 专用 的 互联 网 络 ; 以 及 与 架构 的 风格 相关 的 黏合 逻辑 。 互 联网 络 是 这 种 架构 
的 一 个 关键 部 分 ， 因 为 处 理 右 之 间 有 效 的 数据 分 享 和 同步 依赖 于 互联 网 络 的 性 能 。 

20 世纪 90 年 代 ， 随 着 性 能 强劲 的 单 芯 片 微 处 理 器 (也 称 杀 手 级 微 处 理 器 ) 的 到 来 ， 这 
种 技术 突破 大 大 震动 了 高 性 能 计算 市 场 。 由 于 单 必 片 的 微 处 理 吉 性 能 超过 了 定制 的 处 理 需 ， 
所 以 对 于 并 行 机 器 而 言 ， 构 建 这 种 机 融 在 经 济 方面 的 生命 力 就 变 成 了 一 个 问题 。 其 中 的 一 
些 通 过 自身 再 造 生存 了 下 来 ， 很 多 曾经 叱 哇 风 云 的 并 行 计 算 厂 商 已 经 消失 了 (比如 TMC 和 
Maspar ) - 

除了 单 芯片 微 处 理 器 的 性 能 ， 局 域 网 技术 也 飞速 地 发 展 。 我 们 将 在 第 13 章 介绍 局 域 网 
(LAN) 的 发 展 ， 在 此 我 们 只 需 了 解 ， 随 着 交换 吉 比 特 以 太 网 的 到 来 ( 见 13.8 7), FRAT OLA 


上 专用 互联 网 络 的 需求 就 变 得 越 来 越 小 了 。LAN 技术 的 突破 促 生 了 一 类 新 的 并 行 机 器 一 一 集 
群 。 集 群 是 一 组 用 现 有 的 LAN 技术 连接 起 来 的 计算 节点 。 从 20 世纪 90 年 代 中 后 期 开始 直到 


现在 ， 集 群 就 一 直 是 高 性 能 计算 的 主力 架构 。 集 群 促 进 了 消息 传递 型 编程 的 发 展 ， 而 就 像 我 
们 前 面 说 过 的 ，MPI 通信 库 已 经 成 为 在 集群 上 编程 的 事实 标准 。 当 然 ， 随 着 技术 的 发 展 ， 计 
算 节 点 中 的 内 容 在 发 生变 人 化。 比如， 现在 一 个 nn 路 SMP (n 可 能 是 2、4、8 或 16， 取 决 于 厂商 ) 
作为 一 个 计算 节点 已 经 不 是 什么 罕见 的 事情 了 。 而 且 ， 每 个 SMP 中 的 处 理 器 可 能 是 一 个 硬件 
多 线程 的 多 核 处 理 器 。 这 就 产生 了 一 种 混合 的 并 行程 序 设计 模型 : 在 节点 内 部 使 用 共享 内 存 
型 的 程序 设计 ， 而 在 节点 之 间 使 用 消息 传递 型 的 程序 设计 。 


练习 题 


比较 进程 和 线程 。 

线程 从 哪里 开始 执行 ? 

线程 什么 时 候 终 止 ? 

同时 能 有 多 少 个 线程 获得 一 个 互 斥 锁 ? 

一 个 条 件 变 量 允 许 线程 进行 有 条 件 还 是 无 条 件 的 等 待 ? 
定义 死 锁 。 解 释 死 锁 如 何 发 生 以 及 如 何 防 止 。 
描述 下 列 发 生 的 问题 : 


if(state == BUSY) 
pthread cond wait(c, m); 
state = BUSY; 
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8. 比较 PCB 和 TCB 的 内 容 。 
9. 在 只 调度 进程 而 不 是 线程 的 系统 上 使 用 用 户 级 线程 是 否 有 意义 ”性 能 会 提高 吗 ? 
10. 选择 下 列 中 的 某 一 项 将 句子 补充 完整 : 
在 一 个 单 处 理 器 中 的 用 户 级 线程 同步 
。 不 需要 特别 的 硬件 支持 ， 因 为 关闭 中 断 就 足够 了 。 
。 需要 一 些 能 够 实现 读 取 - 修改 - 写 入 的 指令 。 
。 可 以 简 答 地 通过 load/store 指令 实现 。 
.选择 下 列 中 的 某 一 项 将 句子 补充 完整 : 
确保 一 个 给 定 进 程 的 所 有 线程 共享 SMP 中 的 一 个 地 址 空间 是 
。 不 可 能 的 。 
。 可 以 平凡 实现 的 ， 因 为 页 表 在 共享 内 存 中 。 


l 


— 


416 B1l2¢ 





12. 


一 一 
n 


=i jà 
oo N 


。 可 以 通过 小 心地 给 每 个 线程 复制 操作 系统 页 表 来 实现 。 
。 可 以 通过 提供 缓存 一 致 性 的 硬件 实现 。 

选择 下 列 中 的 某 一 项 将 句子 补充 完整 : 

保持 SMP 中 的 TLB 一 致 

。 是 用 户 程 序 的 责任 。 

。 是 硬件 的 责任 。 

。 是 操作 系统 的 责任 。 

。 是 不 可 能 的 。 


.选择 所 有 对 于 同一 地 址 空间 创建 的 线程 而 言 符合 的 选项 : 


。 它们 共享 代码 。 

。 它们 共享 全 局 数据 。 
。 它们 共享 栈 。 

。 它们 共享 堆 。 


. 从 下 列 关 于 线程 的 描述 中 ， 选 择 正确 的 : 


。 对 于 没有 提供 线程 支持 的 操作 系统 ， 如 果 一 个 进程 中 的 某 个 用 户 级 线程 进行 了 一 个 阻塞 系统 的 调 
用 ， 那 么 操作 系统 就 会 阻塞 整个 进程 。 

。 在 pthread 中 ， 执 行 了 pthread cond wait 的 线程 会 一 直 阻 塞 。 

。 在 pthread 中 ， 执 行 了 pthread mutex lock 的 线程 会 一 直 阻 寨 。 

。 在 Solaris 中 ， 同 一 个 进程 的 所 有 用 户 级 线程 需要 同等 地 竞争 CPU 资源 。 

。 在 Solaris 中 ， 一 个 进程 的 所 有 线程 共享 相同 的 页 表 。 


.说 出 Sun Solaris 中 内 核 线程 的 优势 。 
. 考虑 有 100 000 个 核 的 一 个 多 处 理 器 。 它 用 于 模拟 喷气 式 飞 机 的 机 杆 。 程 序 有 80% 是 平行 的 。 在 这 


个 拥有 100 000 个 核 的 多 处 理 器 上 运行 该 程序 能 获得 多 少 加 速 比 ? 


. 说 出 缓存 一 致 性 策略 中 写 无 效 化 和 写 更 新 之 间 的 区 别 。 
.考虑 下 列 关 于 SMP (对 称 多 处 理 副 ) 的 细节 : 


缓存 一 致 性 协议 : 写 无 效 化 
缓存 到 内 存 的 策略 : AS 


初始 时 ， 情 况 如 下 : 
内 存 位 置 : 
C 包括 31 
D 包括 42 
考虑 下 列 来 自 处理 器 P1、P2 和 了 3 的 内 存 访问 及 其 时 间 顺 序 : 
Tee os EPS 


T3 


填充 下 面 的 表格 ， 写 出 每 一 时 刻 缓存 的 内 容 。 
我 们 已 经 给 出 了 T1 时 刻 的 内 容 。 
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(1 表示 缓存 单元 的 值 是 无 效 的 。NP 表示 还 不 存在 值 。) 
ne 


Tl 3 NP 31 NP 31 
NP NP 50 42 
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19. 为 什么 在 仍然 持 有 与 相应 pthread_cond_wait 相关 联 的 互 斥 锁 时 执行 一 个 pthread_cond_signal 调用 被 
认为 是 一 个 好 的 编程 实践 ? 

20. 为 什么 从 pthread cond wait 调用 处 继续 执行 时 再 检查 断言 条 件 是 一 个 好 的 编程 实践 ? 

21. Æ C 语言 中 用 pthread 库 实现 例 12-17 的 使 用 管 程 的 解决 方案 。 

22. 在 Java 中 实现 例 12-17 的 使 用 管 程 的 解决 方案 。 

23. 使 用 互 斥 锁 写 出 写 者 优先 的 读者 - 写 者 问题 的 解决 方案 - 

24. 使 用 互 斥 锁 写 出 读者 与 写 者 优先 级 相同 的 读者 - 写 者 问题 的 解决 方案 。( 提 示 : 在 解决 方案 中 使 用 
FCFS 规则 ,) 

25. 使 用 管 程 实现 练习 题 23 和 24. 

26. 使 用 Java 实现 练习 题 23 和 24。 

27. 使 用 计数 信号 量 写 出 读者 - 写 者 问题 的 解决 方案 ， 任 意 时 刻 允 许 至 多 个 同时 的 读者 或 者 1 个 写 者 
访问 数据 库 。 

28. 图 12-34 给 出 了 哲学 家 就 餐 问 题 的 管 程 解决 方案 。 使 用 互 斥 锁 重 新 实现 该 解决 方案 。 


参考 文献 注释 和 扩展 阅读 


阅读 一 些 关于 构建 并 行 机 器 早期 尝试 的 文献 会 很 有 意思 。Tlliac IV (20 世纪 60 年 代 开 始 并 花 10 年 
完成 的 一 个 University of Ilinois 项 目 ) [Hord, 1982] .C.mmp (Carnegie Mellon, 20 世纪 70 年 代 初 ) [Wulf, 
1972]， 以 及 Cm* (Carnegie Mellon, 20 世纪 70 年 代 末 ) [Swan, 1977] 就 是 这 样 一 些 早期 的 尝试 。Illiac 
IV 是 一 台 SIMD 风格 的 并 行 机 器 ， 而 C.mmp 和 Cm* 都 是 MIMD 风格 的 并 行 机 器 。 阅 读 这 些 项 目的 相 
关 论 文 和 书籍 会 对 学 生 大 有 帮助 。 

Michael Flynn 的 开创 性 论文 给 出 了 并 行 机 器 的 一 种 分 类 方法 [Flynn, 1966]. H. T. Kung [Kung， 
1979] 将 并 行 算法 按照 最 适合 执行 它们 并 行 机 器 的 类 型 进行 了 分 类 。ISA 在 单 处 理 器 上 是 软 /硬件 的 一 个 
定义 明确 的 接口 。Leslie Lamport 的 开创 性 论文 [Lamport, 1979] 把 顺序 一 致 性 定义 为 内 存 一 致 性 模型 ， 
将 其 作为 共享 内 存 多 处 理 器 上 软 / 硬件 之 间 的 一 个 契约 ， 

20 世纪 80 年 代 和 90 年 代 初 期 ， 大 量 研究 开展 了 如 何 构建 面向 共享 内 存 型 多 处 理 器 的 多 级 存储 融 
体系 可 大 量 研究 。 这 使 得 一 种 新 的 缓存 一 致 性 协议 被 定义 出 来 (参见 [Archibald，1986]， 它 对 基于 总 线 
监听 的 缓存 一 致 性 协议 进行 了 比较 性 的 研究 ) 。 研 究 者 也 致力 于 定义 新 的 内 存 一 致 性 模型 ， 作 为 硬件 与 
软件 之 间 的 契约 ([Adve，1996] 简单 介绍 了 内 存 一 致 性 模型 ) 。 市 场 上 出 现 了 多 种 基于 总 线 的 商业 机 荷 。 

20 世纪 80 年 代 早期 也 有 大 量 关 于 建立 大 规模 多 处 理 器 尝试 的 研究 。 那 段 时 期 的 一 些 著名 例子 包括 
IBM RP3[Pfister, 1985], NYU Ultracomputer[Edler, 1985], Illinois 大 学 的 Cedar 项 目 [Gajski, 1983], 
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以 及 BBN Butterfly[BBN Butterfly, 1986]. 

在 此 之 后 的 下 一 波 并 行 机 器 在 构建 时 扩展 了 多 处 理 器 的 缓存 一 致 性 方案 ,使 得 对 大 规模 共享 内 存 
型 机 各 也 能 较 好 地 工作 。( (Lilja, 1993] 介绍 了 构建 大 规模 缓存 一 致 的 共享 内 存 型 机 器 时 会 遇 到 的 一 
些 问 题 .) 20 世纪 90 年代 的 著名 例子 包括 Kendall Square Research KSR-1[Burkhardt，1992]、Stanford 
ee 1992], 以 及 MIT Alewife[Agarwal, 1995] 

， 构 建 大 规模 并 行 机 器 的 活动 主要 集中 在 工业 界 。 及 时 跟 进 这 方面 前 沿 技术 的 最 佳 方式 是 通过 
RE 算 机 业界 领导 者 (比如 IBM 和 Cray) 的 最 新 进展 。 男 一 个 很 有 用 
的 资源 是 定期 发 布 世界 “前 500 强 ” 超 级 计算 机 的 网 站 ， 上 面 有 它们 的 配置 信息 、 物 理 位 置 ， 以 及 相对 
性 能 等 内 容 ” 

并 行 系统 的 系统 软件 主要 朝 两 个 方面 发 展 。 第 一 个 方面 是 编译 器 、 程 序 设计 语言 和 相关 库 方 面 。 研 
究 者 试图 通过 主要 聚焦 于 编译 带 技 术 来 弄 明 白 如 何 构建 高 性 能 的 并 行 软件 [Kuck，1976 ; Padua, 1980 ; 
Allen，1987]。 这 使 得 在 顺序 程序 设计 语言 中 出 现 了 关于 并 行 扩展 的 定义 (例如 ，FORTRAN-D[Fox， 
1990] 和 IBM Parallel FORTRAN[Toomey，1988])， 也 导致 了 很 多 并 行 编程 库 的 出 现 (例如 ，POSIX 
pthreads[Nichols, 1996], MPI[MPI, 2009 ; Snir, 1998], OpenMP[OpenMP, 2010; Chapman, 2007], 
PVM[Sunderam, 1990], CMU 的 Cthreads[Cooper, 1988], IVY[Li, 1988], Treadmarks[Keleher, 
1994], Shasta[Scales, 1996], Cashmere[Kontothanassis, 2005], LÆ CRL[Johnson, 1995]). 

最 近 的 焦点 开始 转 问 如 何 通过 提供 更 高 级 编程 抽象 的 方式 减少 最 终 用 户 进行 并 行程 序 设计 的 复 
ARE. (jin, Intel 在 并 发 集合 上 的 网 页 [Intel CnC，2009]， 以 及 Google 的 Map-Reduce 编程 [Dean, 
2004].) 另 一 个 焦点 是 多 核 和 众 核 桨 构 上 的 高 效 并 行 编程 运行 时 系统 。 对 于 这 方面 发 展 的 最 新 动 问 ， 可 
以 关注 程序 设计 语言 和 编译 器 方面 的 顶级 会 议 (例如 ，PpoPP OAI PLDI ®), 

第 二 个 方面 是 并 行 机 如 上 高 效 资源 管理 所 需 的 操作 系统 机 制 。 多 处 理 右 调度 是 一 个 已 经 研究 得 较为 
透彻 的 话题 ， 大 多 数 操 作 系 统 书籍 中 都 会 讲 到 这 个 。Mellor-Crummey 和 Scott[Mellor-Crummey, 1991] 
给 出 了 一 个 关于 多 处 理 硕 上 使 用 的 不 同 同步 算 法 的 概述 。 在 操作 系统 结构 上 利用 多 处 理 硕 中 的 局 部 性 从 
过 去 一 直到 现在 都 是 获得 了 很 多 关注 的 话题 。Sun 的 Sprint 内 核 [Mitchell，1994] AI IBM 的 K42 项 目 
[Krieger, 2006] 就 是 这 样 的 例子 。 

最 近 ， 学 术 界 和 工业 界 都 开始 大 量 关注 虚拟 化 技术 ， 从 而 对 资源 进行 有 效 的 利用 ， 在 不 同 用 户 
之 间 提 供 隔 离 ， 并 能 很 好 地 从 软 /硬件 故障 中 快速 恢复 。 资 源 虚 拟 化 的 基础 内 容 ， 可 以 参考 [Barham, 
2003] MRENA EER. 同样 ， 访 问 VMware 公司， 以 及 Xen @ 开 源 项 目的 网 站 也 是 在 这 个 领域 
获取 最 新 进展 的 好 途径 。 这 方面 的 顶级 学 术 会 议 有 SOSPS、OSDI， 以 及 Usenix Annual Technical 
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http://www.top500.org/ - 

Principles and Practice of Parallel Programming: http://polaris.cs.uiuc.edu/ppopp10/. 
PLDI: http://cs.stanford.edu/pldi10/., 

http://www.vmware.com/ 。 

http://xen.org/. 

Sympopsium on Operating Systems Principles: http://www.sigops.org/sosp/sosp09/ 
Operating System Design and Implementation: http://www.usenix.org/event/osdil0/. 
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Usenix Annual Technical Conference: http://www.usenix.org/event/atc10/。 
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网 络 与 网 络 协 议 基 础 知识 


设想 你 的 计算 机 没有 连接 到 因特网 。 我 们 会 认为 这 样 的 计算 机 功能 齐全 吗 ? 多 半 不 会 。 
虽然 我 们 现在 把 因特网 和 网 络 连接 看 作 理 所 当然 的 ,但 弄 清楚 我 们 如 何 从 最 开始 到 达 这 一 步 
仍然 会 有 启示 。 我 们 会 在 本 革 结 尾 回顾 网 络 的 发 展 史 。 首 先 ， 我们 要 了 解 网 络 连接 计算 机 的 
基本 要 素 ， 无 论 这 些 计 算 机 是 在 同一 栋 楼 里 还 是 横 跨 了 半 个 地 球 。 


13.1 预备 知识 


正如 我 们 在 第 10 章 中 提 到 的 。 外 围 设备 与 计算 机 系统 的 其 余部 分 通过 以 下 两 种 方式 之 一 相 
互 连 接 : 程控 IO (Programmed I/O) 或 者 直接 内 存 访问 (Direct Memory Access，DMA)。 前 者 
适用 于 低速 设备 ， 后 者 适用 于 高 速 设备 。 网 卡 是 一 种 高 速 设备 ， 使 用 DMA 与 系统 相连 。 

到 现在 为 止 ， 我 们 从 前 面 曹 节 中 学 到 的 关于 计算 机 的 一 切 都 在 我 们 的 控制 之 中 ， 包 括 计 
算 机 中 的 硬件 和 处 理 硬 件 的 操作 系统 抽象 。 虽 然 将 计算 机 连接 到 网 络 只 需要 一 块 简单 的 DMA 
硬件 ， 但 这 样 的 连接 所 带 来 的 影响 却 是 深远 的 。 与 使 用 仍然 是 计算 机 中 的 磁盘 等 外 围 设备 不 
同 ， 连 接 到 网 络 就 将 使 计算 机 暴露 于 整个 世界 之 中 。 将 计算 机 连接 到 网 络 使 我 们 能 够 浏览 网 
页 ， 与 世界 任何 地 方 的 朋友 聊天 ， 同 时 作为 网 络 中 信息 的 使 用 者 和 贡献 者 。 另 一 方面 ， 我 们 
无 法 控制 网 络 上 所 发 生 的 一 切 ， 且 无 法 预测 这 变幻 英 测 的 网 络 会 如 何 影响 我 们 的 计算 机 。 这 
就 像 乘坐 过 山 车 你 想 要 寻求 刺激 感 ， 但 需要 有 安全 的 保障 。 

关于 网 络 的 讨论 有 很 多 主题 ， 包 括 网 络 协议 、 网 络 安全 、 网 络 管理 、 网 络 服务 等 。 
可 以 肯定 地 说 ， 这 些 主题 中 的 每 个 都 有 专门 的 教科 书 ， 我 们 在 参考 书目 中 列 出 了 一 些 好 
的 参考 书 。 

本 章 坚 持 本 书 的 主题 ， 即 硬件 和 操作 系统 ， 因 为 它们 属于 你 的 计算 机 。 伴 随 这 个 目标 ， 
第 13 章 将 从 硬件 和 操作 系统 的 角度 ， 专 注 于 网 络 的 基本 原理 ， 为 你 带 来 一 个 特殊 的 计算 机 网 
络 之 旅 。 我 们 的 目的 不 是 深入 细节 ， 而 是 让 你 更 全 面 地 了 解 网 络 ， 它 会 激 起 你 更 深入 地 学 习 
这 个 主题 的 兴趣 。 本 章 不 涵盖 与 网 络 安全 和 网 络 管理 相关 的 内 容 。 

我 们 采取 自 上 而 下 的 方法 来 探索 计算 机 网 络 这 个 有 趣 的 领域 。 操 作 系 统 有 3 个 部 分 会 
促进 计算 机 与 网 络 连接 。 就 像 pthreads 库 提供 了 一 套 开发 多 线程 程序 的 API 一 样 ，socket 
库 提供 了 一 套 开发 网 络 应 用 程序 的 API。 为 操作 系统 定义 并 实现 这 套 API 是 简化 网 络 编程 
的 第 一 步 。 我 们 很 快 就 会 看 到 ， 要 使 应 用 程序 产生 的 消息 到 达 它 们 的 目的 地 ， 会 涉及 很 多 
方面 的 问题 。 解 决 所 有 这 些 问 题 的 抽象 称 作 协议 栈 ( protocol stack)， 它 是 操作 系统 向 化 
网 络 编程 的 第 二 部 分 。 计 算 机 自身 通过 网 卡 (Network Interface Card, NIC) 与 网 络 相 连 。 
操作 系统 中 与 网 卡 交互 的 网 络 设 备 驱动 程序 (network device driver) 是 简化 网 络 编程 的 第 
三 部 分 。 


13.2 基本 术语 
我 们 将 通过 学 习 一 些 基 本 术语 来 开始 我 们 的 旅程 。 在 网 络 用 语 中 ， 连 接 到 网 络 的 计算 





机 称 作 主机 (host)。 为 了 将 计算 机 连接 到 网 络 ， 我 们 需要 一 个 外 设 探 制 器 ， 它 称 为 网 卡 
(Network Interface Card, NIC). KI 13-1 展示 了 连接 到 网 络 的 多 人 台 主 机 。 

图 13-1 使 用 了 一 条 巨大 的 云 来 表示 网 络 ， 但 图 中 的 网 络 究 竟 是 什么 ?我 们 很 快 就 会 看 
到 ， 它 其 实 是 多 个 网 络 的 集合 ， 这 个 网 络 集 合 的 名 称 是 因特网 (Internet). 





图 13-1 连接 到 网 络 的 各 种 主机 


什么 是 因特网 ? 打开 任何 一 本 有 关 计 算 机 网 络 的 书 ， 它 都 会 以 一 种 独特 的 方式 来 回答 这 个 
问题 ， 而 本 书 尝试 以 你 的 角度 来 解答 这 个 问题 。 拿 邮政 服务 来 做 类 比 。Vasanthi 和 布 望 从 佐治 亚 
州 亚 特 兰 大 市 给 她 在 印度 泰 米尔 纳 德 邦 Mailpatti 的 奶奶 寄 一 封 信 ， 她 在 信封 上 写 上 她 奶奶 的 地 
址 ， 再 把 信 投 入 信箱 ( 见 图 13-2 )。 之 后 邮 北 员 取 走 这 封 信 。 当 然 ， 取 信和 的 邮 北 员 并 不 知道 如 
何 把 这 封 信 一 路 送 到 Vasanthi 的 奶奶 那里 ， 邮 递 员 只 了 解 他 上 自己 的 路 线 那些 需要 他 投递 与 
收取 邮件 的 房屋 。 但 他 知道 如 果 把 邮件 递交 到 当地 邮局 ， 那 里 的 邮政 工人 负责 这 些 邮件 剩余 的 
旅途 。 让 我 们 进一步 了 解 这 个 故事 ， 因 为 它 与 因特网 的 工作 方式 类 似 。 这 些 信件 在 邮局 里 被 分 
选 整理 ， 送 往 印 度 泰 米尔 纳 德 邦 的 信件 被 整理 放置 在 一 个 特定 的 箱子 中 。 最 终 ， 这 个 箱子 被 空 
运 到 印度 钦 奈 ， 信 件 从 钦 奈 的 主 邮 局 被 送 往 Mailpatti 的 邮局 。 因 为 没有 通 往 奶奶 家 的 公路 ， 所 
以 Mailpatti 的 邮局 使 用 一 辆 牛 车 来 运送 这 最 后 的 一 公里 。 奶 奶 收 到 信件 非常 高 兴 。 

Vasanthi 信件 的 旅程 与 Charlie 给 他 在 加 利 福 尼 亚 州 尤 巴 市 的 母亲 发 送 的 电子 邮件 的 旅程 有 
着 惊人 的 相似 之 处 。Charlie 居住 在 亚特兰大 ， 他 家 使 用 调制 解 调 器 通过 电缆 接 人 和 人 因特网， 调制 
解 调 器 将 Charlie 与 互联 网 服务 提供 商 (Internet Service Provider, ISP) 相连 。ISP 作为 Charlie 连 
和 人 因特网 的 接 入 点 ， 它 代表 了 一 个 接 入 网 (access network)。 人 们 可 以 通过 许多 途径 (ONAL AR 
电话 线 、 卫 星 等 ) 来 访问 因特网 。 每 个 人 依据 自己 的 情况 与 襄 好 选择 一 个 合适 的 ISP。 接 入 网 就 
如 同 邮递 员 ， 它 知道 如 何 从 指定 计算 机 获取 东西 或 者 向 给 定 计 算 机 发 送 东 西 ， 但 不 知道 如 何 让 
Charlie 的 电子 邮件 一 路 传送 到 加 利 福 尼 亚 州 的 母亲 。 然 而 接 和 网 知道 如 何 把 电子 邮件 传送 给 区 
域 I SP， 区 域 ISP 在 功能 上 与 本 地 邮局 非常 相似 。 区 域 ISP 知道 如 何 与 其 他 在 全 国 乃 至 世界 各 
地 的 区 域 ISP 通信 。Charlie 的 电子 邮件 通过 亚特兰大 地 区 的 ISP 发 送 到 加 利 福 尼 亚 海湾 地 区 的 
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ISP. be Charlie 的 电子 邮件 以 外 ， 还 有 更 多 消息 在 亚特兰大 和 和 海湾 地 区 之 间 穿 梭 。 因 此 ， 网 
络 核心 能 够 处 理 更 大 的 流量 ， 这 类 似 于 仅 用 一 架 邮政 飞机 ， 就 能 运送 所 有 从 美国 寄 到 印度 泰 米 
尔 纳 德 邦 的 邮件 。 通 过 海湾 地 区 的 区 域 I SP， 电 子 邮 件 到 达 尤 巴 市 的 接 入 网 。Charlie 的 母亲 不 
太 会 使 用 计算 机 ， 她 通过 一 个 连接 到 她 计算 机 的 调制 解 调 器 使 用 电话 线 拨号 连接 到 因特网 。 对 
Charlie 的 母亲 来 说 ， 接 和 人 网 是 尤 巴 市 当地 的 电话 公司 。 将 电子 邮件 传送 到 Charlie 母亲 计算 机 
的 慢 速 拨号 连接 ， 类 似 于 最 终 将 Vasanthi 的 信件 传送 到 她 奶奶 的 牛 车 。 





图 13-2 ”从 美国 佐治 亚 州 亚特兰大 市 到 印度 泰 米尔 纳 德 邦 Mailpatti 的 邮递 


图 13-3 中 的 每 打 ISP 云 代表 了 相应 ISP 的 计算 机 系统 。 这 些 ISP 系统 之 间 不 直接 相互 连 
接 。 在 网 络 核心 中 有 称 为 路 由 器 的 设备 ， 负 责 在 全 球 各 种 ISP 之 间 路 由 消息 。 区 域 ISP 通过 
网 络 核心 来 知晓 其 他 的 ISP 以 及 向 其 他 的 ISP 路 由 消息 。 这 咋 一 看 就 像 是 魔术 一 样 ， 但 事实 
并 非 如 此 。 在 佐治 亚 州 亚特兰大 市 的 地 方 邮 局 如 何 知道 Vasanthi 写 给 她 奶奶 的 信件 应 该 用 飞 
机 运往 印度 钦 奈 ? 因为 美国 邮政 服务 普遍 采用 了 美国 邮政 编码 (ZIP code) 来 标识 全 球 范 围 内 
的 每 一 个 地 区 。 因 特 网 同样 使 用 了 一 个 通用 的 寻 址 系统 来 标识 每 一 个 可 能 连 入 因特网 的 设备 ， 
这 就 是 大 家 所 熟知 的 IP 地 址 (Internet Protocol address, IP address), Charlie 和 他 母亲 的 计算 
机 都 拥有 一 个 全 球 唯一 的 IP 地址 。 接 和 人 网、 互联 网 服务 提供 商 (ISP) 和 核心 网 络 合 在 一 起 组 
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成 了 我 们 通常 所 说 的 因特网 。 总 之 ， 因 特 网 是 一 个 由 网 络 组 成 的 网 络 。 





图 13-3 Charlie 的 电子 邮件 从 佐治 亚 州 亚特兰大 市 到 达 加 利 福 尼 亚 州 尤 巴 市 


要 理解 因特网 中 的 数据 包 传输 ， 最 关键 的 一 点 是 ， 一 个 从 源 发 往 目 的 的 数据 包 会 穿 过 途 
中 一 系列 位 于 路 由 器 输入 端的 队列 。 在 没有 任何 竞争 的 情况 下 ， 这 些 队 列 都 是 空 的 ，Charlie 
的 电子 邮件 将 顺利 通过 这 些 路 由 帮 ， 到 达 他 妈妈 的 计算 机 。 然 而 ,在 存在 其 他 流量 的 情况 
下 (如 网 络 拥塞 ， 参 见 13.6.3 节 )， 数 据 包 可 能 会 在 途中 的 路 由 需 遭 遇 到 排队 延迟 (queuing 
delay)。 由 于 队列 的 大 小 有 限 ， 所 以 如 果 一 个 路 由 需 的 队列 已 满 ， 数 据 包 可 能 会 丢 奔 ， 从 而 导 
致 数据 包 丢 失 (packet loss)。 因 此 ， 排 队 延 迟 和 数据 包 丢 失 是 因特网 中 数据 包 传 输 所 拥有 的 
内 在 问题 。 我 们 将 在 13.3 节 、13.6 节 和 13.12 节 更 详细 地 讨论 这 些 方 面 。 

在 抽象 层次 上 ， 邮 政 服务 将 信件 从 人 4 投递 到 人 8。 让 我 们 来 看 看 全 球 邮政 服务 的 基础 
配套 设施 ， 它 包括 邮递 员 、 自 行车 、 汽 车 、 船 只 ， 其 至 牛 车 ， 还 包括 邮政 火车 、 贷 车 和 飞机 。 
同样 ， 因 特 网 由 一 大 堆 小 设备 所 支撑 。 在 本 章 的 其 余部 分 深入 人 研究 细节 之 前 ， 让 我 们 对 网 络 
的 概况 做 一 个 马 梧 。 

我 们 将 扩展 之 前 对 主机 的 定义 ， 以 涵盖 我 们 在 日 常生 活 中 所 接触 的 各 种 计算 机 (笔记 本 
电脑 、 掌 上 电脑 以 及 Web 服务 器 和 邮件 服务 需 等 服务 器 )。 这 些 计算 机 代表 了 网 络 边 缘 。 我 
们 还 经 常 听 到 术语 叫 客户 端 和 服务 器 ， 这 些 术 语 主要 是 指 一 个 给 定 的 主机 所 扮演 的 角色 。 例 
如 ， 当 我 们 用 Google 进行 搜索 时 ， 我 们 的 机 器 就 是 一 个 客户 端 ， 在 另 一 端的 搜索 引擎 中 对 应 
的 机 器 就 是 服务 器 。 网 络 边缘 与 网 络 核心 也 有 所 区 别 ， 位 于 网 络 深 处 路 由 数据 包 的 机 器 构成 
网 络 核心 。 
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现在 ,如果 你 在 学 校 、 办 公 室 或 者 宿舍 ， 你 会 将 你 的 计算 机 连接 到 一 个 局 域 网 ( Local 
Area Network，LAN)。 即 使 是 在 家 里 ,特别 是 在 西方 国家 ,许多 人 可 能 有 一 个 局 域 网 来 连接 
家 中 所 有 的 机 融 。 正 如 我 们 已 经 提 到 的 ， 你 在 家 里 会 连接 到 一 个 ISP， 这 可 能 是 一 家 有 线 电 
视 公 司 、 一 家 电话 公司 或 者 一 家 卫星 公司 。 这 些 ISP 之 间 有 彼此 通信 的 方法 ， 因 此 无 论 网 络 
边缘 使 用 了 哪 一 个 ISP， 在 佐治 亚 州 亚特兰大 市 的 Charlie 总 是 能 够 给 他 在 加 利 福 尼 亚 州 尤 巴 
市 的 母亲 发 送 电子 邮件 。 还 有 一 些 其 他 类 型 的 配件 共同 完善 因特网 的 基础 设施 ， 包 括 传 输 位 
的 物理 介质 目 身 和 连接 主机 与 物理 介质 的 电子 线路 。 这 些 电 路 包括 了 集线器 / 中 继 器 、 网 桥 、 
交换 机 和 路 由 器 。 我 们 将 在 13.9 节 讨 论 这 些 硬件 元 素 和 它们 的 功能 。 接 下 来 ,我 们 将 讨论 网 
络 软件 。 


13.3 网 络 软 件 


网 络 软件 是 任何 现代 操作 系统 的 重要 组 成 部 分 ， 我们 通常 把 操作 系统 的 这 一 部 分 称 作协 
议 栈 (protocol stack)。 让 我 们 先 来 了 解 什么 是 网 络 协议 ， 它 是 一 种 定义 计算 机 之 间 彼 此 通信 
的 消息 的 语法 和 语义 的 语言 。 读 者 可 能 已 经 从 本 章 使 用 的 术语 猜 到 了 ， 协 议 是 为 了 使 任意 两 
个 实体 之 间 能 进行 交互 而 规定 的 公约 。 例 如 ， 即 使 在 计算 机 内 部 ， 处 理 器 和 内 存在 内 存 总 线 
(memory bus) 上 的 交互 行为 也 遵守 相应 的 协议 。 我 们 在 2.8 节 讨 论 的 为 寄存 器 保存 /恢复 所 
规定 的 公约 也 是 一 种 在 调用 者 与 被 调用 者 之 加 的 协议 。 

然而 ， 用 于 计算 机 之 间 通 信 的 协议 由 于 各 种 原因 变 得 复杂 。 例 如 ， 我们 在 局 域 网 中 使 用 
的 一 种 协议 会 不 断 地 检查 以 太 网 (13.8.1 节 )。 以 太 网 使 用 的 数据 包 大 小 最 大 为 1318 字 节 ， 
称 为 1 帧 ， 它 包含 了 数据 、 目 的 地 址 以 及 其 他 保证 数据 传输 完整 性 所 必需 的 信息 。 对 于 给 定 
的 网 络 技术 ， 它 所 使 用 的 数据 包 的 大 小 限制 主要 依据 协议 设计 约束 来 决定 ， 而 在 介质 上 的 最 
大 传输 速率 则 是 男 一 个 问题 。 就 像 处 理 紫 的 时 钟 速度 是 实际 使 用 的 逻辑 延迟 特 性 的 函数 ， 任 
何 网 络 技术 的 最 大 传输 速率 限制 也 是 由 物理 层 信 号 传输 的 性 质 和 驱动 介质 的 逻辑 延迟 特性 所 
决定 的 。 

让 我 们 来 考虑 网 络 的 使 用 情况 。 你 可 能 会 通过 网 络 从 宿舍 给 你 的 家 人 发 送 在 教室 里 拍摄 
的 图 像 ， 图 像 可 能 有 几 兆 大 小 。 你 立刻 就 可 以 看 到 问题 ， 一 个 网 络 数据 包 无 法 容纳 整个 图 像 ， 
因此 ， 你 的 一 条 消息 (任意 大 小 ) 需要 拆 分 成 多 个 更 小 的 数据 包 来 满足 网 络 介质 的 物理 限制 。 
将 一 条 消息 拆 分 成 一 组 数据 包 带 来 了 另 一 个 问题 。 见 图 13-3 ， 我 们 看 到 从 Charlie 的 计算 机 发 
出 的 数据 包 可 能 要 通过 多 种 不 同 的 网 络 才 能 到 达 他 妈妈 家 里 的 计算 机 ， 并 且 除 了 Charlie 的 电 
子 邮件 外 ， 网 络 上 还 有 其 他 流量 。 无 论 是 否 有 竞争 的 网 络 流量 ， 我 们 都 无 法 预测 他 的 电子 邮 
件 会 经 历 多 少 排队 延迟 ， 无 法 保证 一 条 消息 的 一 组 数据 包 会 按 顺 序 到 达 目 的 地 。 考 虑 一 个 由 
3 个 数据 包 组 成 的 消息 ， 数 据 包 编号 为 0、1、2， 发 送 端 按 顺序 发 出 数据 包 。 但 是 在 发 送 端 和 
接收 端 之 间 可 能 有 多 条 路 径 ， 网 络 可 以 沿 不 同 的 路 径 自由 地 路 由 数据 包 ， 接 收 端 收 到 数据 包 
的 顺序 可 能 是 0、2、1。 接 收 端 必须 正确 地 组 合 这 些 数 据 包 以 便 构成 原始 的 消息 。 因 此 ， 数 据 
包 的 乱 序 到 达 是 数据 传输 的 第 二 个 问题 。 第 三 个 问题 源 自 网 络 体系 结构 目 身 的 性 质 一 一 在 这 
个 完全 分 散 的 网 络 中 ， 网 络 的 各 个 部 分 各 自决 定 其 中 的 数据 包 如 何 组 区 、 转 发 和 忽略 。 因 此 ， 
网 络 中 的 数据 包 可 能 会 丢失 。 数 据 包 通过 网 络 时 发 生 数据 包 丢 失 一 般 是 由 于 资源 不 足 (例如 
传输 途中 路 由 器 的 缓冲 区 容量 不 足 )。 第 四 个 问题 涉及 传输 过 程 中 的 瞬时 故障 ， 这 可 能 会 改变 
数据 包 的 内 容 。 即 数据 包 在 网 络 传输 过 程 中 可 能 会 产生 位 错误 。 

我 们 总 结 了 与 消息 传输 相关 的 一 系列 问题 : 
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1 ) 任意 的 消息 大 小 与 网 络 数据 包 的 物理 限制 ; 

2) 数据 包 的 乱 序 到 达 ; 

3) 网 络 中 的 数据 包 丢 失 ; 

4) 传输 中 产生 的 位 错误 ; 

5 ) 传输 途中 的 排队 延迟 。 

当然 ,我们 也 可 以 让 应 用 程序 来 解决 所 有 的 这 些 问题 ,但 是 如 果 这 样 做 ,任何 网 络 应 用 
程序 都 需要 考虑 这 些 问题 ， 因 此 解决 这 些 问 题 并 作为 操作 系统 的 一 部 分 是 有 意义 的 。 操 作 系 
统 解 决 这 些 问 题 的 部 分 就 是 协议 栈 。 我 们 很 快 会 清楚 为 什么 这 部 分 软件 称 为 协议 栈 。 

就 像 系 统 软 件 (编译 此 和 操作 系统 ) 让 任意 的 应 用 程序 数据 结构 存 人 结构 严 间 的 物理 内 
存 一 样 ， 协 议 栈 让 一 个 任意 大 小 的 应 用 程序 消息 在 网 络 中 传输 ， 并 在 目的 地 将 消息 完整 重 构 。 
图 13-4 表示 了 在 两 个 不 同 主机 上 的 两 个 进程 P1 和 P2 之 间 的 消息 交换 。 


用 户 
操作 系统 
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网 络 
图 13-4 两 个 网 络 连 接 的 节点 之 间 的 消息 交换 。 消 息 分 解 成 数据 包 ， 并 通过 连接 节点 的 
物理 介质 发 送 


13.4 HNI 

我 们 应 该 如 何 构建 协议 栈 ” 一 种 可 能 的 方式 是 实现 一 个 包含 所 有 我 们 之 前 讨论 的 功能 ， 
以 保证 从 源 到 目的 地 的 消息 可 靠 传 输 。 这 种 方法 的 缺点 是 ， 它 将 物理 网 络 的 细节 不 必要 地 搁 
绑 到 了 协议 中 。 例 如 ， 如 果 物 理 网 络 发 生变 化 ， 则 整个 协议 会 受到 影响 。 

协议 分 层 恰好 能 解决 这 个 问题 。 协 议 分 层 使 用 抽象 的 力量 来 分 离 这 些 关 系 ， 而 不 是 把 所 
有 功能 捆绑 到 一 个 协议 中 。 这 就 是 为 什么 我 们 把 这 一 块 操作 系统 称 作协 议 栈 。 发 出 的 消息 会 
逐步 从 最 顶层 的 应 用 程序 到 达 最 底层 的 物理 介质 。 类 似 地 ， 收 到 的 消息 会 逐步 从 最 底层 的 线 
路 到 达 最 顶层 的 应 用 程序 。 


13.4.1 因特网 协议 栈 

接 下 来 ,我 们 需要 了 解 协议 栈 必 须要 解决 的 细节 。 自 从 其 起 源 于 20 世纪 60 FARRAR, 
这 一 直 是 网 络 研究 的 重点 。Vinton Cerf 和 Robert Kahn 等 互联 网 杰出 人 物 曾 经 展望 ， 较 小 的 网 
络 岛屿 可 能 需要 通过 网 络 连接 在 一 起 ， 形 成 更 大 的 网 络 ， 由 此 创造 了 网 络 互 联 (Internetting ) 
这 个 术语 。 当 然 ， 现 在 因特网 已 经 是 一 个 家 喻 户 晓 的 词 。 到 20 世纪 70 年 代 末 ， 当 今 无 处 不 
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在 的 许多 协议 ， 如 TCP、UDP、IP， 其 概念 已 经 在 因特网 协议 架构 中 存在 。 
图 13-5 展示 了 5 层 的 因特网 协议 栈 ， 我 们 将 对 每 一 









层 的 作用 进行 快速 总 结 。 在 本 章 后 面 的 章节 中 ， 我 们 将 ey 
更 深入 地 讨论 传输 层 、 网 络 层 和 链 路 层 。 

应 用 层 ( application layer) 顾名思义 ,这 一 层 负责 39 
支持 基于 网 络 的 应 用 ， 例 如 即时 通信 (IM)、 多 人 视频 游 层 1 


戏 、P2P 音乐 /视频 共享 、Web 浏览 器 、 电 子 邮 件 和 文 
件 传输 。 在 这 一 层 中 可 以 使 用 多 种 协议 ,包括 用 于 Web 
应 用 程序 的 HTTP 协议 、 用 于 电子 邮件 的 SMTP 协议 ， 
以 及 用 于 文件 传输 的 FTP HN, KEE, 这些 协议 的 作 
用 是 为 应 用 程序 实体 (客户 端 、 服 务 器 、 对 等 节点 ) 之 间 相互 通信 提供 一 种 共同 的 语言 。 

传输 层 (transport layer) 这 一 层 负 责 处 理应 用 层 的 消息 并 在 通信 终端 之 间 传 输 。 当 然 ， 
这 一 层 需 要 担忧 我 们 之 前 讨论 过 的 变幻 葛 测 的 网 络 (例如 ， 将 消息 拆 分 成 数据 包 、 处 理 数 
据 包 的 乱 序 到 达 )。 现 在 因特网 上 主要 使 用 的 两 个 传输 协议 是 TCP 和 UDP。 传输 控制 协议 
( Transmission Control Protocol, TCP) 在 两 个 端点 之 间 为 应 用 程序 的 数据 提供 一 个 可 靠 的 和 有 
序 交付 的 基于 字 节 流 的 传输 。TCP 是 面 癌 连接 的 协议 。 也 就 是 说 ， 在 实际 的 数据 传输 发 生 之 
前 ， 在 两 个 端点 之 间 先 建立 逻辑 连接 9， 很 像 一 次 电话 呼叫 。 一 旦 会 话 结束 ， 就 会 关闭 连接 ， 
这 在 网 络 用 语 中 通常 称 为 拆除 (teardown) 连接 。 男 一 方面 ， 用 户 数 据 报 协 议 ( User Datagram 
Protocol, UDP) 类 似 于 通过 美国 邮政 发 送 一 张 明 信 片 。 它 处 理 有 严格 界限 的 消息 。 也 就 是 说 ， 
使 用 UDP 连续 发 送 的 消息 在 协议 层 之 间 不 存在 任何 关系 。 简 单 地 说 ，TCP 提供 了 流 语 义 的 数 
据 传输 ， 而 UDP 提供 了 数据 报 语义 的 数据 传输 。 在 发 送 消息 前 UPD 不 会 建立 任何 连接 ， 在 
发 送 消 息 后 也 没有 连接 拆除 。 使 用 UDP 时 消息 可 能 会 乱 序 到 达 ， 因 为 该 协议 不 保证 按 序 传 
俞 。 总 之 ， 这 两 个 主要 的 网 络 传输 协议 之 间 最 显著 的 差异 是 ，TCP 为 端 到 端 提 供 有 序 可 靠 的 
数据 传输 ， 而 UDP 不 提供 这 些 。 

网 络 层 (network layer) 传输 层 不 知道 如 何 将 数据 包 从 源 路 由 到 目的 地 ， 路 由 是 协议 栈 
中 网 络 层 的 责任 。 网 络 层 的 作用 很 简单 : 在 发 送 端 ， 网 络 层 寻找 一 条 路 径 将 传输 层 给 予 的 数 
据 包 传送 到 预期 的 目的 地 址 。 在 接收 端 ， 网 络 层 将 数据 包 传 送 给 传输 层 ， 再 由 传输 层 负 责 将 
数据 包 整 理 成 传递 给 应 用 层 的 消息 。 从 这 个 意义 上 说 ， 网 络 层 的 作用 与 邮政 服务 非常 类 似 ， 
将 信件 投入 邮箱 ， 并 希望 信件 能 够 到 达 目 的 地 。 当 然 ， 邮 政 服 务 由 一 个 人 来 阅读 信封 上 的 地 
址 ， 并 确定 如 何 最 好 地 将 信 送 到 目的 地 。 在 网 络 层 处 理 数据 包 时 ， 我 们 需要 一 个 确切 的 格式 
来 描述 数据 包 中 的 信息 (地 址 ， 数 据 等 )。 在 因特网 用 语 中 ， 这 层 协 议 的 通用 名 称 是 IP 协议 
(Internet Protocol)， 它 包含 了 数据 包 格 式 和 识别 数据 包 疝 目的 地 传输 的 路 由 。 

链 路 层 (link layer) 回想 邮政 服务 的 类 比 ，Vasanthi 的 信件 从 佐治 亚 州 亚特兰大 市 被 空运 
到 印度 钦 奈 ,但 是 从 Mailpatti 邮局 到 奶奶 家 的 最 后 的 一 公里 却 只 能 使 用 牛 车 运送 。 飞 机 和 和 牛 
车 作为 邮政 服务 的 不 同 渠 道 ， 在 邮政 系统 运送 Vasanthi 的 信件 时 负责 不 同 的 旅程 。 链 路 层 承 担 
类 似 的 作用 ， 在 因特网 的 节点 之 间 传 送 IP 数据 包 ， 使 数据 包 能 够 从 源 路 由 到 目的 地 。 以 太 网 
( Ethernet), JIK (Token Ring) Al IEEE 802.11 都 是 链 路 层 协议 。 网 络 层 根据 数据 包 将 要 采取 


图 13-5 因特网 协议 栈 这 种 结构 上 自 
从 20 世纪 70 年 代 末 确 定 以 
来 ,一 直 使 用 这 5 层 协议 栈 


O ”电话 设备 通过 预先 分 配 物 理 资源 ， 在 两 端 之 间 建 立 一 个 真正 的 连接 ， 称 作 电路 交换 ( 见 13.7.3). A— 
方面 ，TCP 是 面向 连接 的 ， 因 为 它 在 两 端 之 间 只 提供 是 一 个 连接 的 外 观 ， 不 需要 预先 分 配 物 理 资 源 ( 见 
13.6.5 7) 


6 


的 下 一 跳 将 耳 数 据 包 发 送 到 相应 的 链 路 层 (如 果 需 要 ， 网 络 层 会 依据 链 路 层 的 特性 将 IP 数据 
包 拆 分 成 更 小 的 片段 )。 链 路 层 将 这 些 片 段 传递 到 下 一 跳 ， 那 里 它们 被 传 回 网络 层 。 这 个 过 程 一 
直 重 复 到 数据 包 (可 能 被 分 段 ) 到 达 目 的 地 。 明 显 可 以 看 到 ， 一 个 卫 数 据 包 在 它 的 旅途 中 可 能 
被 多 种 链 路 层 协议 处 理 。 在 目的 地 ， 网 络 层 重 组 这 些 片 段 来 重 构 原 始 的 IP 数据 包 。 

物理 层 (physical layer) 这 一 层 负 责 在 物理 上 ( 电 、 光 等 ) 将 数据 包 的 位 从 一 个 节点 传输 
到 下 一 个 节点 。 从 这 个 意义 上 说 ， 这 一 层 与 链 路 层 密切 相关 。 一 个 给 定 的 链 路 层 协 议 可 能 使 
用 多 种 物理 介质 来 传输 位 ， 而 每 一 种 物理 介质 都 可 能 有 独特 的 物理 层 协议 。 人 例如， 以太 网 可 
能 对 于 双 绞 线 、 同 轴 电 绕 、 光 纤 等 不 同 物理 介质 使 用 不 同 的 物理 层 协议 。 

图 13-6 展示 了 一 条 消息 从 源 出 发 经 过 多 次 网 络 跳 到 达 目 的 地 所 经 过 的 协议 栈 。 
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图 13-6 数据 包 通 过 网 络 的 旅途 。 中 间 节 点 作为 “中 继 ” 向 目的 地 传输 消息 的 数据 包 


在 任意 两 层 协 议 栈 之 间 ， 有 着 明确 的 接口 。 分 层 模 型 使 每 层 协议 能 够 独立 于 其 他 层 模 块 
化 地 决策 。 

分 层 是 一 个 结构 化 的 工具 ， 避 免 了 复杂 的 协议 栈 。 它 划分 各 层 之 间 消 息 传 输 与 接收 的 责 
任 。 模 块 化 可 以 使 新 的 模块 集成 在 某 个 特定 的 层 上 ， 尽 量 不 改变 其 他 层 。 例 如 ， 在 协议 栈 中 ， 
新 出 现 的 物理 层 会 影响 链 路 层 ， 但 原则 上 不 会 影响 网 络 层 和 传输 层 。 乍 一 看 这 似乎 是 一 个 淤 
在 的 不 利 因素 ， 分 层 可 能 造成 性 能 的 损失 ， 因 为 消息 需要 穿 过 多 层 协议 。 然 而 明智 地 定义 层 
与 层 之 间 的 接口 可 以 防止 效率 降低 。 

对 于 协议 栈 的 层 数 并 没有 明确 的 规定 。 实 际 上 ， 这 取 
决 于 协议 栈 所 提供 的 功能 。 


13.4.2 OSI 模型 


应 用 层 







图 13-7 OSI 参考 模型 是 由 国际 标 
准 化 组 织 (ISO) 制定 的 
一 个 抽象 参考 模型 


国际 标准 化 组 织 (International Standards Organization, 
ISO) 已 经 制定 了 一 个 7 层 模型 的 协议 栈 ， 即 开放 系统 互 连 
(Open Systems Interconnection, OSI) 模型 。OSI 7 层 模 型 
是 一 个 抽象 的 参考 模型 ， 用 于 说 明 协 议 栈 的 功能 并 建议 如 
何 划分 各 层 。 图 13-7 展示 了 这 个 参考 模型 。 

比较 图 13-5 和 图 13-7， 我 们 可 以 看 到 后 者 比 前 者 多 了 
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两 层 : 表示 层 (presentation) 和 会 话 层 (session)。 顾 名 思 义 ， 会 话 层 负责 管理 两 个 端点 之 间 
特定 的 通信 会 话 。 例 如， 假设 你 在 网 络 上 与 朋友 有 几 个 同步 的 即时 通信 (IM) 会 话 ， 会 话 层 
对 每 个 这 样 的 通信 会 话 维护 进程 级 的 信息 。 传 输 层 负责 保证 任何 端 到 端的 消息 可 靠 传 输 ， 会 
证 层 抽 象 应 用 程序 消 县 传输 的 细节 ， 提 出 一 个 更 高 级 的 应 用 程序 接口 (例如 ，UNIX 套 接 字 )。 
表示 层 闻 盖 了 许多 应 用 程序 所 共有 的 功能 。 例 如 ， 格 式 化 显示 窗口 中 的 文本 输出 是 独立 于 你 
可 能 会 使 用 的 特定 IM 客户 端 程序 (AOL, MSN 等 ) 的 。 因 此 ， 不 依赖 于 应 用 程序 内 部 细节 
的 演示 功能 (如 本 地 显示 文本 字符 、 格 式 化 和 字符 转换 ) 属于 表示 层 。 


13.4.3 ”分 层 的 实际 问题 


OSI 模型 作为 一 个 有 用 的 参考 模型 ， 确 保 每 个 协议 栈 的 实现 涵盖 所 有 必要 的 功能 。 然 而 ， 
实际 实现 的 协议 栈 很 少 能 够 严格 坚持 模型 所 规定 的 分 层 。 作 为 实际 问题 ， 因 特 网 随 着 20 世纪 
80 年 代 所 定义 的 OSI 模型 一 同 发 展 。 正 如 我 们 之 前 提 到 的 ， 对 于 负责 网 络 通信 的 传输 层 和 网 
络 层 ，TCP/P 协议 是 事实 上 的 标准 。 主 要 的 观察 结果 是 ， 在 因特网 演变 的 过 程 中 ， 如 TCP 和 
IP 之 类 的 标准 协议 导致 OSI 模型 划分 的 层次 折 和 至 。 例 如 HTTP, FTP 和 SMTP 等 协议 包含 了 
OSI 模型 中 的 第 7 ~ 5 层 , TCP 和 UDP 在 OSI 模型 的 第 4 层 , PEET OSI 模型 中 第 3 层 
的 功能 ， 网 络 接口 《如 计算 机 的 以 太 网 卡 ) 假定 在 OSI 模型 中 的 第 2 层 。 

我 们 对 于 5 层 网 络 协议 栈 给 出 了 一 个 高 层次 的 描述 ， 有 许多 优秀 的 教科 书 涵盖 了 这 样 层 
次 的 细节 。 我 们 从 一 开始 就 说 过 ， 本 草 的 目的 是 让 读者 从 系统 体系 结构 和 操作 系统 的 角度 更 
全 面 地 了 解 作 为 一 个 重要 IO 设备 的 网 络 。 

我 们 将 采取 上 自 上 而 下 的 方法 来 探索 协议 栈 的 各 个 层 以 及 其 中 的 设计 思想 。 我 们 从 应 用 层 
开始 讨论 ， 为 其 余 的 篇 章 设 定 背 景 。 我 们 会 特别 强调 传输 层 ， 因 为 这 是 与 操作 系统 接触 最 紧 
密 的 地 方 。 然 后 我 们 继续 沿 栈 向 下 讨论 网 络 层 ， 网 络 层 同样 也 是 操作 系统 的 一 部 分 。 最 后 我 
们 探讨 最 接近 系统 体系 结构 的 链 路 层 。 

接 下 来 说 明 本 章 其 余部 分 的 组 织 结构 。 我 们 在 接 下 来 的 几 节 中 对 传输 层 、 网 络 层 和 链 路 
层 进 行 一 定 深 度 的 探索 ， 是 否 需 要 这 些 细 节 取 决 于 读者 自身 的 看 法 。 由 于 我 们 已 经 对 这 些 层 
的 功能 给 出 了 一 个 高 层次 的 概述 ， 所 以 如 果 谈 者 觉得 没 必 要 详细 了 解 传 输 层 、 网 络 层 和 链 路 
屋 ， 则 完全 可 以 跳 过 接 下 来 的 这 几 节 。13.9 节 概述 在 现代 计算 机 系统 中 所 使 用 的 网 络 硬件 。 
13.10 节 将 讨论 层 与 层 之 间 的 关系 ， 然 后 继续 探索 在 操作 系统 中 实现 协议 栈 的 问题 。 


13.5 ”应 用 层 


正如 我 们 所 知 ， 因 特 网 应 用 程序 已 经 不 计 其 数 ， 从 手机 到 高 性 能 计算 集群 ， 接 人 网 络 的 
设备 无 处 不 在 。 这 里 ， 分 清 应 用 程序 和 应 用 层 协 议 是 很 重要 的 。 

一 般 来 说 ， 任 何 网 络 应 用 程序 都 包含 两 个 部 分 : 

。 客户 端 : 这 部 分 是 在 掌上 电脑 、 手 机 、 笔 记 本 电脑 和 台式 机 等 终端 设备 上 。 

。 服务器 : 这 部 分 提供 一 些 网 络 服务 预期 功能 〈( 例 如， 搜索 引擎 ) 。 

网 络 应 用 程序 的 例子 包括 万 维 网 (World Wide Web,，WWW)、 电 子 邮 箱 和 网 络 文件 系 
统 ( Network File Systems，NFS)。 例 如 ，WWW 的 客户 端 是 一 个 Web 浏览 器 ， 如 Firefox 或 
Internet Explorer, WWW 的 服务 器 端 称 作 Web 服务 器 ， 包 括 Apache 9 (一 个 开源 的 Web 服务 
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需 平 台 ， 用 来 构建 Web 代理 等 通用 服务 ) 和 Google 与 Yahoo! 等 向 用 户 提供 专业 服务 的 门户 
网 站 。 另 一 个 例子 ， 电 子 邮 箱 的 客户 端 是 Microsoft Outlook 和 UNIX Pine 等 程序 ， 服 务 器 端 
是 Microsoft Exchange 等 邮件 服务 需 。 

网 络 应 用 程序 远 比 应 用 层 协议 大 很 多 。 例 如 ，Web 浏览 器 能 够 保留 URL 的 访问 历史 、 绥 
存 下 载 的 网 页 等 ， 这 些 细节 使 得 每 个 应 用 程序 各 不 相同 。 另 一 方面 ， 由 于 网 络 应 用 程序 在 客 
户 端 和 服务 硕 之 间 的 消息 交换 已 经 被 明确 定义 ， 所 以 它们 被 实现 在 应 用 层 协 议 中 。 

应 用 层 协议 能 够 适应 不 同类 型 的 网 络 应 用 程序 。 例 如 ，Web 应 用 程序 使 用 超 文本 传输 协 
议 (Hyper-Text Transfer Protocol, HTTP) 来 规定 Web 客户 端 和 服务 需 之 间 的 交互 行为 。 同 样 ， 
电子 邮箱 使 用 人 简单 邮件 传输 协议 (Simple Mail Transfer Protocol, SMTP) 来 规定 邮件 客户 端 和 
服务 需 之 间 的 交互 行为 。 

WWW 和 电子 邮件 等 许多 网 络 应 用 程序 ， 经 第 超出 计算 机 人 硬件 体系 结构 和 操作 系统 的 限 
制 。 这 就 是 为 什么 你 能 够 从 手机 以 及 机 场 和 网 吧 等 的 公共 终端 来 阅读 电子 邮件 或 访问 CNN 或 
BBC 等 热门 网 站 。 因 此 ，HTTP Al SMTP 等 应 用 层 协 议 是 独立 于 平台 (定义 为 硬件 体系 结构 
和 操作 系统 的 结合 ) 的 标准 ， 无 论 这 些 应 用 程序 的 客户 端 或 服务 硕 在 什么 平台 上 。 

男 一 方面 ， 操 作 系 统 也 提供 它们 自己 独 有 的 网 络 服务 。 例 如 ， 你 能 够 通过 UNIX 文件 系 
统 访问 文件 ,或 者 通过 UNIX 终端 使 用 网 络 打印 机 。 这 也 是 客户 疹 -服务 硕 应 用 程序 增强 
操作 系统 功能 的 例子 。 为 了 支持 这 些 应 用 程序 的 开发 ， 操 作 系 统 提 供 了 网 络 通 信和 库 。 类 似 于 
pthreads 库 为 一 个 地 址 空间 内 的 线程 之 间 的 交互 行为 提供 API， 这 些 库 为 网 络 中 客户 端 与 服务 
器 的 交互 行为 提供 API。 这 样 的 通信 库 同样 代表 一 个 应 用 层 协议 。 例 如 ，UNIX 操作 系统 提供 
J BES (socket) 库 来 作为 构建 网 络 应 用 程序 的 API。 其 他 流行 的 操作 系统 ， 如 微软 的 Vista 
和 苹果 的 Mac OS， 也 提供 了 一 套 类 似 的 API 来 支持 在 它们 的 平台 上 开发 网 络 应 用 程序 。 与 
实现 一 个 多 线程 库 类 似 (参见 第 12 章 )， 操 作 系 统 实现 套 接 字库 的 API 也 会 涉及 一 些 具 体 问 
题 ， 这 些 问 题 已 经 超出 了 本 书 的 范围 。 有 兴趣 的 读者 可 以 参考 讨论 这 些 细节 问题 的 其 他 书籍 
[Wright, 1995; McKusick，2004]。 我 们 将 在 13.15 节 讨 论 使 用 套 接 字 API 进行 网 络 编程 的 基 
本 问题 。 


13.6 ”传输 层 


我 们 假设 传输 层 提供 了 一 组 应 用 程序 编程 接口 (Application Program Interface, API) 调用 ， 
以 便 使 应 用 层 能 够 在 网 络 上 发 送 和 接收 数据 。 

e send (目的 地 址 ， 数 据 ) 

e receive ( 源 地 址 ， 数 据 ) 

让 我 们 列举 协议 栈 中 传输 层 的 预期 功能 : 

1 ) 在 应 用 层 上 支持 任意 的 数据 大 小 。 

2 ) 支持 数据 的 按 序 交 付 。 

3 ) 保护 应 用 程序 不 受 数据 丢失 的 影响 。 

4 ) 保护 应 用 程序 不 受 传输 过 程 中 的 位 错误 的 影响 。 

传输 层 可 以 以 字 节 流 或 消息 的 形式 查看 来 自 应 用 层 的 数据 。 相 应 地 ， 传 输 可 以 是 面向 数 
据 流 或 者 面向 连接 的 (例如 ，TCP 协议 )， 在 这 种 情况 下 ， 应 用 程序 数据 被 认为 是 连续 的 字 方 
流 。 传 输 层 将 数据 分 成 称 为 段 的 预定 义 单元 ， 并 将 这 些 段 发 送 到 目的 地 的 传输 层 。 或 者 ， 传 
输 层 可 以 是 面向 消息 或 面向 数据 报 的 (例如 ， 用 户 数 据 报 ( UDP) 协议 )， 在 这 种 情况 下 ， 处 


(a 2% +5 A ah fo iz 429 


理应 用 程序 数据 的 方式 类 似 于 通过 邮政 系统 发 送 明信片 。 为 了 方便 讨论 ， 我 们 只 使 用 消息 
(message) 来 指 代 在 传输 层 传输 的 单位 内 容 。 

为 了 满足 网 络 硬 件 的 限制 ， 传 输 层 在 源 就 将 数据 拆 分 成 数据 包 ， 在 目的 地 的 对 等 传输 层 
再 将 数据 包 重 新 组 合成 原始 的 消息 并 传递 给 消息 接收 者 。 我 们 将 这 组 功能 称 作 分 散 〈scatter) / 
收集 (gather) 9。 由 于 数据 包 可 能 不 会 按 顺 序 到 达 目 的 地 ， 所 以 在 源 的 传输 层 对 消息 的 每 个 
数据 包 都 赋予 了 一 个 唯一 的 序号 。 无 论 数 据 包 到 达 接 收 端 的 顺序 如 何 ， 都 可 以 按照 序号 来 重 
组 为 原始 的 消息 。 因 此 ， 为 每 个 数据 包 附 加 一 个 唯一 的 号 可 以 解决 网 络 通 信 中 的 前 两 个 问题 ， 
即 任意 的 消息 大 小 和 乱 序 到 达 。 

由 于 数据 包 在 传输 途中 可 能 会 丢失 或 损坏 ， 所 以 源 需 要 确认 目的 地 已 经 接收 到 了 数据 包 。 
任何 情况 对 传输 层 来 说 ， 结 果 都 是 数据 包 没 有 到 达 预 定 的 目的 地 。 数 据 包 丢失 或 损坏 并 不 是 
什么 神秘 的 事情 ， 大 家 都 经 历 过 双手 都 还 拿 不 下 全 部 购物 袋 的 时 候 ， 这 时 你 可 能 已 经 抒 了 一 
两 件 物品 ， 但 你 很 难 在 别人 告诉 你 之 前 意识 到 这 一 点 。 我 们 需要 考虑 网 络 中 的 物理 资源 ， 当 
讨论 网 络 层 时 我 们 会 看 到 ， 这 些 资源 在 高 负载 时 可 能 会 到 达 其 容量 限制 ， 从 而 导致 数据 包 丢 
失 。 同 样 ， 传 输 过 程 中 的 电磁 干扰 可 能 会 导致 位 错误 。 应 当 提 到 的 是 ， 这 样 的 位 错误 并 不 总 
会 使 数据 包 完 全 无 法 使 用 。 我 们 会 在 本 节 结 束 时 看 到 ， 当 发 生 位 错误 时 ， 可 以 对 数据 包 进 行 
纠 钳 ， 这 通常 称 为 前 向 纠 错 (Forward Error Correction，FEC)。 但 是 当 错 误 超 出 FEC 算法 的 
修复 能 力 时 ,仍然 等 价 于 数据 包 于 失 。 协 议 需 要 具备 识别 数据 包 丢 失 的 能 力 ， 一 种 可 能 的 方 
法 是 使 用 肯定 确认 (positive acknowledgement)， 如 图 13-8 所 示 。 或 许 你 在 发 送 邮 件 时 已 经 使 
用 过 邮政 服务 的 “挂号 信 ” 功 能 。 邮 政 服 务 将 签 了 名 的 回执 返回 给 发 件 人 来 证 明 邮 件 已 经 成 
功 交 给 了 收 件 人 。 邮 政 服务 给 每 封 挂号 信 一 个 唯一 的 ID 用 于 追踪 。 传 输 层 中 的 肯定 确认 就 类 
似 于 此 服务 。 需 要 注意 的 是 ， 传 输 层 有 一 个 重要 
的 参数 ， 叫 做 往返 时 间 (Round Trip Time, RTT). 
RTT 定义 为 一 个 小 消息 (如 0 字 节 ) A AIK Hg Bl 
达 接 收 端 ， 之 后 再 回 到 发 送 端 所 需要 的 时 间 ( 参 
见 图 13-8). RTT 是 发 送 端 发 送 一 个 消息 之 后 再 收 
到 确认 消息 所 需要 的 估计 时 间 ， 在 13.6.1 市 我 们 将 
看 到 它 用 于 选择 重 传 超 时 值 .RTT 取决 于 许多 因 系 ， 
包括 发 送 端 到 接收 端的 距离 、 在 网 络 途中 的 排队 延 
迟 ， 以 及 发 送 端 与 接收 端 处 理 消息 的 开销 。 

但 是 ， 网 络 与 邮政 服务 也 有 一 些 重 要 的 区 别 。 
第 一 ， 邮 政 服务 中 的 邮局 会 为 发 送 人 提供 确认 《以 
回执 的 形式 ) ;而 网 络 中 的 确认 消息 只 会 停留 在 与 Sens een 
邮局 相似 的 传输 层 。 不 会 传递 给 应 用 程序 。 第 一 ， BOS SRAM RR. Ae 
邮政 服务 中 的 邮件 会 作为 整体 被 传递 ， 仅 需要 一 个 al eee: Be 
确认 消息 ; 而 网 络 中 的 消息 会 被 传输 层 拆 分 成 许多 RE 
数据 包 。 传 输 层 对 于 如 何 处 理 确认 消息 有 许多 种 选择 ， 并 且 这 些 选择 产生 了 众多 的 传输 协议 。 


13.6.1 停止 并 等 待 协议 


一 种 简单 的 实现 方法 需要 做 到 以 下 几 点 。 
O TCP 中 的 说 法 ， 称 为 将 数据 流 划 分 (segmenting) 成 数据 包 ，。 





时 间 时 间 


1 ) Aix aA: IR —-P REL, EER PE A, AY TA PKA ACK. 

2) Hom Ac Bl— 7 aL, A KAS PS HG A ACK. ACK 需要 包含 数据 包 的 信 
息 以 使 发 送 端 识别 被 确认 的 数据 包 。 由 于 序号 是 每 个 数据 包 的 唯一 签名 ， 所 以 ACK 包 中 只 需 
要 包含 已 接收 数据 包 的 序号 。 

3) 发 送 端 在 发 送 数据 包 之 后 会 等 待 一 段 时 间 ， 这 段 时 间 称 为 超时 〈timeout)。 如 有 果 发 送 
端 在 这 段 时 间 内 没有 收 到 数据 包 的 ACK， 就 会 重新 发 送 该 数据 包 ， 如 图 13-9 所 示 。 同 样 ， 
如 果 接 收 端 再 次 收 到 相同 的 数据 包 ， 也 会 重新 发 送 ACK (这 表示 接收 端的 ACK 在 途中 丢失 
了 ， 如 图 13-10 所 示 ) 。 







Pkt1 ACK 


重 传 
Pkt1 ACK 


Pkt1 ACK 





时 间 时 间 时 间 时 间 
图 13-9 EEE, WREIK m EE AN 图 13-10 ” 收 到 重复 的 数据 包 。 如 果 接 收 病 
有 收 到 确认 ， 就 会 重新 发 送 数据 包 收 到 了 相同 的 数据 包 ， 束 会 重新 
发 送 该 数据 包 的 确认 


我 们 把 这 种 协议 称 作 停止 并 等 待 ( stop-and-wait) 协议 ， 因 为 发 送 端 在 发 送 一 个 数据 包 后 
会 停止 传输 ， 并 在 继续 发 送 下 一 个 数据 包 前 等 得 一 个 ACK。 


用 停止 并 等 待 协议 方法 进行 可 靠 传输 时 ， 发 送 端 需要 在 协议 栈 中 缓存 多 少数 据 包 ? 
x 


答案 是 1。 因 为 发 送 端的 协议 栈 一 次 只 发 送 一 个 数据 包 并 等 待 ACK。 


我 们 为 什么 一 定 需 要 序号 呢 ? 毕竟 在 收 到 当前 数据 包 的 ACK 之 前 ， 发 送 端 不 会 继续 发 送 
下 一 个 数据 包 。 原 因 非 常 简单 和 直观 。 数 据 包 和 ACK 包 都 可 能 会 丢失 ， 因 此 发 送 端 和 接收 端 
的 协议 都 具备 在 超时 后 重 传 数据 包 的 机 制 。 发 送 端 如 何 知道 一 个 收 到 的 ACK 是 确认 当前 数据 
包 还 是 重复 确认 前 一 个 数据 包 ? 这 就 是 序号 的 作用 。 根 据 单调 递增 的 序列 号 ， 发 送 端 可 以 判 
断 收 到 的 ACK 是 当前 数据 包 的 ACK 还 是 重复 的 ACK. 

让 我 们 看 看 能 不 能 简化 这 个 协议 中 数据 包 的 序号 。 根 据 协 议 ， 在 任意 时 刻 源 和 目的 
地 之 间 都 恰好 只 有 一 个 数据 包 正 在 传输 ， 我 们 真 的 需要 为 数据 包 分 配 一 个 单调 递增 的 序 
号 吗 ? 确实 不 需要 。 因 为 依照 这 个 协议 ， 数 据 包 会 按 顺 序 从 源 到 达 目 的 地 传输 ， 序 号 纯 
粹 是 为 了 消除 重复 。 所 以 我 们 只 需要 使 用 1 位 来 表示 序号 就 足够 了 。 协 议 以 序号 0 发 送 
数据 包 并 等 待 序 号 为 0 的 ACK。 当 收 到 序号 为 0 的 ACK 时 ， 以 序号 1 继续 发 送 下 一 个 
数据 包 并 等 待 序号 为 1 的 ACK。 因 为 这 个 原因 ， 停 止 并 等 待 协 议 也 经 常 称 为 交替 位 协议 
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(alternating bit protocol), 

让 我 们 看 看 如 何 选取 超时 时 间 。 以 我 们 以 
往 的 经 验 ， 我 们 知道 去 学 校 所 花费 的 时 间 很 可 
能 与 从 学 校 回 家 的 时 间 不 一 样 。 因 为 我 们 可 能 
选择 不 同 的 路 线 、 交 通 状 况 可 能 不 一 样 等 。 这 
对 消息 传输 来 说 也 一 样 ， 消 息 从 发 送 端 到 接收 
端 所 经 过 的 路 径 很 可 能 与 反方 向 时 不 同 ， 两 个 
方向 上 的 排队 延迟 也 不 一 样 ， 这 些 都 可 能 导致 
网 络 中 消息 往返 的 测量 时 间 不 对 称 。 由 于 这 个 
原因 ， 消 息 的 往返 时 间 (RTT) 比 单 向 传输 时 间 
更 加 有 用 。 我 们 将 在 13.12 节 详 细 讨 论 消息 传 
输 时 间 ， 现 在 我 们 只 需要 注意 超时 时 间 必 须 比 
预期 的 RTT 时 间 长 。 

图 13-11 展示 了 发 送 端 和 接收 端 按 照 停 止 并 
等 待 协 议 传输 消息 时 ， 数 据 包 与 ACK 包 的 传递 时 间 时 间 
过 程 。 图 中 RIT 是 消息 的 往返 时 间 ， 发 送 端 必 “网 13.11 停止 并 等 待 协议 发 送 数据 和 的 时 间 
须 在 传输 一 个 数据 包 之 后 等 待 一 个 RTT 时 间 来 轴 。 每 个 数据 包 都 会 被 单独 确认 
接收 ACK， 之 后 再 准备 发 送 下 一 个 数据 包 ， 如 发 送 端 只 有 在 收 到 前 一 个 数据 包 的 


此 循环 。 ACK 后 才 会 发 送 下 一 个 数据 包 
GREP) 一 条 消息 有 10 个 数据 包 ， 数 据 包 的 RTT 时 间 是 2 毫秒 (ms)。 假 设 发 送 数据 包 和 接收 ACK 
的 时 间 与 介质 中 的 传播 时 间 相 比 可 以 忽略 不 计 ， 且 没有 发 生 数 据 包 丢失 。 那 么 停止 并 等 待 协议 需要 多 少 
时 间 来 完成 数据 传输 ? 

=. 


会 : 

在 本 例 中 ，RTT=2 ms。 

因此 ， 消 息 传输 的 总 时 间 =10 x RTT 
=10X2 ms 
=20 ms 





13.6.2 流水线 协议 


停止 并 等 待 协议 的 优点 在 于 简单 ， 但 是 如 果 你 在 因特网 上 下 载 电 影 ， 你 一 定 不 会 乐意 于 
使 用 这 个 协议 。 从 图 13-11 可 以 看 出 ， 当 发 送 端 等 待 ACK 到 达 时 ， 网 络 有 大 量 的 时 间 处 于 空 
载 状态 。 空 载 时 间 (dead time) 定义 为 网 络 没有 任何 活动 的 时 间 。 如 果 计 算 机 有 吉 比 特 的 网 络 
连接 ,那么 我 们 在 网 络 空闲 的 每 1 秒 内 都 可 以 发 送 1 比特 的 数据 。 前 面 协议 的 缺陷 是 它们 假 
设 数据 包 于 失 是 一 种 常态 ， 而 不 是 一 种 例外 ， 这 个 假定 可 能 会 导致 网 络 带 宽 的 利用 率 严 重 不 
足 。 例 如 ， 在 例 13-2 中 ，RTT 是 2ms。 换 句 话 说 ,传输 层 每 2ms 发 送 一 个 数据 包 ， 得 到 传输 
层 的 吞吐 量 为 500 数据 包 / 秒 。 如 果 每 个 数据 包 中 有 1000 字 节 的 有 效 数 据 ， 则 传输 层 的 吞吐 
量 是 4 兆 比 特 / 秒 。 也 就 是 说 ， 我 们 只 使 用 了 可 用 网 络 带宽 的 0.4%， 吉 比特 网 络 连接 的 利用 
率 严重 不 足 。 如 果 网 络 是 可 靠 的 ( 即 没 有 数据 包 丢 失 )， 我 们 可 以 快速 地 连续 发 送 消息 的 所 有 
数据 包 ， 而 不 需要 等 待 任何 ACK. 

例如 ， 如 果 网 络 是 可 靠 的 (没有 数据 包 丢 失 )， 那 么 我 们 可 以 将 数据 包 传 输 流 水 线 化 ， 不 
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需要 等 待 ACK， 如 图 13-12 所 示 。 

这 里 区 分 开 带 宽 (bandwidth) 和 传播 时 间 (propagation time) 是 很 重要 的 。 带 宽 决 定 了 主 
机 将 一 个 数据 包 传 入 线路 所 需要 的 时 间 。 传 播 
时 间 与 端 到 端的 延迟 相关 ， 它 是 数据 传输 途中 。 Lee lee [ee |- 
的 传播 延迟 与 排队 延迟 的 累积 函数 。 我 们 将 在 
13.12 节 重 新 考虑 这 个 问题 ， 并 对 这 些 术 语 给 出 图 13-12 YA ACK 的 流水 线 化 数据 包 传 输 
更 精确 的 定义 。 


一 条 消息 有 10 个 数据 包 ， 从 源 向 目的 地 发 送 一 个 数据 包 的 时 间 是 lms。 假 设 发 送 /接收 数据 
包 的 时 间 与 介质 中 的 传播 时 间 相 比 可 以 忽略 不 计 ， 且 没有 发 生 数据 包 丢 失 。 那 么 没有 ACK 的 流水 线 协 
议 需要 多 少时 间 来 完成 数据 传输 ? 

=. 


这 与 前 面 的 例子 相似 ， 但 有 一 个 区 别 : 数据 包 是 流水 线 的 ， 如 图 13-12 所 示 。 产 生 数 据 包 并 将 它们 传 
入 线路 的 时 间 可 以 忽略 不 计 ， 因 此 所 有 数据 包 到 达 目 的 地 所 需 的 时 间 只 是 从 源 到 目的 地 的 端 到 端 延 识 。 
传输 总 时 间 一 1 MSo 


发 送 端的 时 间 轴 


这 个 极端 的 例子 虽然 不 切实 际 ， 但 它 显 示 了 数据 包 流水 线 的 重要 性 ， 特 别 是 当 从 源 到 达 目 的 
地 有 巨大 延迟 时 。 图 13-13 形象 地 展示 了 停止 并 等 待 协议 和 流水 线 协 议 的 区 别 。 在 图 13-13a 中 ， 
任意 时 刻 都 只 有 一 个 数据 包 处 于 传输 过 程 中 ， 而 在 图 13-13b 中 ， 可 以 同时 传输 多 个 数据 包 。 


图 13-13 停止 并 等 待 传输 和 流水 线 传输 的 区 别 


图 13-12 引出 了 一 个 问题 ,我 们 真 的 需要 ACK 吗 ? 这 个 问题 的 答案 实际 上 取决 于 应 用 程 
序 需 要 传输 层 提 供 的 服务 保障 。 例 如 ， 有 些 应 用 程序 可 能 不 需要 可 靠 的 传输 。 我 们 很 快 就 会 
看 到 (在 13.6.5 节 )，UDP 是 一 种 不 使 用 ACK 的 传输 协议 ， 它 就 适用 于 这 种 应 用 。 然 而 有 些 
应 用 程序 可 能 需要 可 靠 的 传输 ， 就 像 使 用 邮政 服务 “挂号 信 ” 功 能 的 人 。 对 于 这 样 的 应 用 程 
序 ， 我 们 不 能 假定 网 络 是 一 定 可 靠 的 ， 因 此 我 们 无 法 省 去 ACK。 


13.6.3 可靠 的 流水 线 协议 


对 极端 的 停止 并 等 待 协议 和 没有 ACK 的 流水 线 协议 的 折 中 方法 是 将 发 送 数 据 包 和 接收 
ACK 流水 线 化 。 发 送 端 在 等 待 确认 之 前 先 发 送 一 组 数据 包 ( 称 为 一 个 窗口 )。 接 收 端 与 之 前 一 
样 ， 对 每 个 数据 包 单 独 进行 确认 。 但 好 消息 是 ， 发 送 端 不 需要 等 到 所 有 的 数据 包 确 认 ， 就 可 
以 继续 开始 发 送 。 图 13-14 形象 地 展示 了 这 种 情况 。 
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时 间 时 间 
图 13-14 ”可 靠 的 带 ACK 的 流水 线 传输 (窗口 大 小 =4 )。 发 送 端 在 开始 等 待 ACK 之 前 会 
发 送 一 个 窗口 的 数据 包 


如 图 13-14 所 示 ， 发 送 端 (窗口 大 小 为 4) 发 送 4 个 数据 包 ， 并 等 待 ACK; 当 收 到 ACKO 
时 ， 就 能 够 发 送 Pkt4。 理 想 的 情况 下 ， 没 有 数据 包 丢 失 ， 发 送 端 一 直 重 复 这 种 循环 。 即 发 
送 端 发 送 Pkt4 ~ Pkt? 然后 等 待 ; 当 收 到 ACK4 时 ， 发 送 端 会 开始 发 送 接 下 来 的 4 个 数据 包 
Pkt8 ~ Pkt11， 以 此 类 推 ， 直 到 消息 传输 完毕 。 

当 发 送 端 收 到 一 个 数据 包 的 ACK 之 后 ， 那 个 数据 包 的 传输 就 完成 了 。 窗 口 的 大 小 可 以 是 
由 协议 双方 商定 的 参数 ， 或 者 由 发 送 端 根 据 网 络 拥塞 情况 进行 动态 调整 。 

网 络 拥塞 (network congestion) 让 我 们 来 了 解 究 竟 什 么 是 网 络 拥塞 ， 以 及 它 为 什么 
会 发 生 。 

打 个 简单 的 比方 ,考虑 高 速 公 路 为 什么 会 在 每 天 的 某 些 时 段 中 堵车 一 一 例如 ， 在 高 峰 时 
期 。 通 常会 有 许多 支线 公路 在 向 高 速 公 路 传输 流量 ， 而 在 路 途 的 另 一 端 ， 人 们 会 离开 高 速 公 路 
重新 进入 各 条 支线 公路 。 此 外 ， 不 同方 向 的 高 速 公 路 可 能 会 在 城市 中 心 合 并 。 一 种 或 多 种 原因 
会 导致 高 速 公 路 堵车 。 即 使 在 高 速 公 路 饱和 之 后 ， 也 会 不 断 有 更 多 的 汽车 尝试 从 文 线 公路 开 上 
高 速 公 路 。 在 路 途 的 另 一 端 ， 和 希望 下 高 速 公 路 的 汽车 会 因为 支线 公路 容量 有 限 (车 道 数量 、 速 
度 限制 、 交 通 灯 等 ) 而 无 法 离开 。 当 两 条 高 速 公路 合并 时 ， 和 车道 的 数量 也 会 少 于 原 有 的 总 量 。 

网 络 拥塞 也 是 由 于 几乎 完全 一 样 的 原因 。 考 虑 下 图 的 情况 。 


1 Gbps = 
1 Gbps 
1 Gbps 10 Gbps 

有 4 条 1Gbps ( 吉 比 特 每 秒 ) 线路 的 网 络 流量 进入 可 以 支持 高 达 10Gbps 的 线路 。 即 使 所 
有 的 4 条 线路 都 是 满 流 量 状态 ，10Gbps 的 胖 线路 也 能 够 满足 它们 的 需求 。 但 是 ， 如 有 宁 有 20 
条 这 样 的 支 路 都 进入 这 条 胖 线路 ， 你 立刻 可 以 看 到 网 络 无 法 满足 这 样 的 速度 需求 ， 部 分 网 络 
流量 将 开始 堵塞 。 这 就 是 网 络 拥塞 的 原因 和 表现 形式 。 网 络 拥塞 的 结果 是 在 路 由 需 的 数据 包 
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队列 堆积 ， 使 数据 包 在 途中 的 路 由 需 队 列 里 等 待 ， 不 能 直接 通过 路 由 器 。 这 最 终 将 会 导致 不 
可 预知 的 排队 延迟 ， 就 像 高 速 公 路 在 高 峰 期 堵车 一 样 。 之 后 如 果 路 由 咒 的 硬件 队列 被 十 满 ， 
则 路 由 器 会 因为 缺乏 缓冲 区 空间 而 简单 地 丢弃 数据 包 ， 导 致 数据 包 丢 失 。 

你 可 能 会 好 奇 为 什么 会 设计 出 一 个 可 能 会 拥塞 的 网 络 ， 答 案 是 相当 简单 的 。 就 像 我 们 已 
经 看 到 的 ， 因 特 网 是 一 个 网 络 的 网 络 。 回 到 我 们 从 亚特兰大 加 班加罗尔 发 送 消息 的 例子 ( 见 
图 13-13 )， 我 们 注意 到 这 些 消 息 会 穿 过 许多 不 同 网 络 的 网 络 链 路 。 在 发 送 端 你 可 能 有 一 个 吉 
比特 网 络 连 接 ， 网 络 核 心 也 可 以 满足 许多 吉 比 特 链 路 的 需求 ， 但 是 位 于 班加罗尔 的 最 终 目的 
地 可 能 只 使 用 缓慢 的 拨号 连接 来 连 和 因特网。 这 类 似 于 较 慢 的 支线 公路 与 快速 的 高 速 公 路 。 
除非 所 有 的 端 到 端 链 路 都 拥有 相同 的 带宽 ， 否 则 我 们 无 法 避免 网 络 拥塞 。 

在 高 速 公 路 上 遭遇 到 交通 堵塞 时 ， 我 们 每 个 人 都 可 能 有 独自 的 处 理 方 式 。 从 出 口 离开 ， 
喝 一 杯 咖啡 ， 做 一 会 儿 四 胶 伸 展 运动 等 。 传 输 协 议 也 会 做 类 似 的 事情 来 应 对 网 络 拥塞 。 例 如 ， 
它 可 能 会 根据 观察 到 的 网 络 拥塞 状况 ， 自 我 调节 传送 给 网 络 层 的 数据 量 。 随 处 可 见 的 因特网 
传输 协议 TCP， 在 这 种 情况 下 也 会 为 了 共同 的 利益 而 进行 自我 调节 。 其 基本 思想 是 ， 如 果 大 
家 都 行为 良好 ， 那 么 每 个 网 络 流 都 将 根据 带宽 总 量 与 当前 的 流量 状况 ， 公 平地 得 到 一 份 可 用 
的 网 络 带宽 。 换 名 话说 ， 一 个 行为 良好 的 传输 协议 会 调节 自己 产生 的 网 络 负载 ， 以 确保 在 网 
络 流量 竞争 中 只 使 用 了 自己 应 有 的 那 一 份 。 

当然 ， 这 种 方法 也 有 其 缺点 。 包 含 拥塞 控制 的 协议 不 能 保证 数据 能 够 尽快 到 达 预 期 的 接 
收 端 。 例 如 ， 如 果 其 他 传输 协议 不 遵循 这 样 的 自我 调节 机 制 ， 那 么 一 个 行为 良好 的 协议 作为 
一 个 好 人 ， 将 会 是 最 终 的 输家 。 你 也 看 到 过 高 速 公路 上 那些 自以为是 的 司机 ， 一 路 上 不 给 他 
人 留 余 地 ， 竭 尽 所 能 地 超车 。 也 就 是 说 ， 使 用 行为 良好 的 传输 协议 时 ， 不 存在 明确 的 延迟 上 
限 ， 或 者 说 不 能 保证 有 最 低 的 传输 速率 。 当 你 试图 访问 网 络 上 的 信息 时 ， 等 待 时 间 可 能 会 有 
很 大 的 差距 。 因 为 Web 应 用 程序 所 使 用 的 底层 传输 协议 TCP 是 一 个 包含 拥塞 控制 的 行为 良好 
的 协议 。 由 于 这 个 原因 ， 需 要 实时 传输 保障 的 网 络 应 用 程序 (如 视频 和 音频 ) 可 能 会 选择 使 用 
UDP， 并 在 其 上 上 自己 提供 可 靠 性 。 

滑动 窗口 (sliding window) 包含 拥塞 控制 的 传输 协议 通过 调节 窗口 大 小 来 进行 自律 。 窗 
口 大 小 限制 了 数据 的 发 送 速 率 ， 进 而 减少 路 由 需 中 堆积 的 队列 ， 缓 解 网 络 拥塞 。 

我 们 已 经 知道 ， 发 送 端 将 消息 拆 分 成 一 组 数据 包 ， 每 个 数据 包 都 有 唯一 的 序号 。 因 此 ， 
对 于 一 个 给 定 的 窗口 大 小 ， 我 们 定义 发 送 端 不 需要 等 待 ACK 就 可 以 发 送 的 这 组 数据 包 (与 序 
号 ) 为 一 个 活动 窗口 (active window)， 如 图 13-15 所 示 9。 我 们 可 能 会 问 ， 什 么 决定 了 每 个 数 
据 包 的 宽度 (width)。 宽 度 表 示 了 发 送 端 将 一 个 数据 包 从 计算 机 传人 网 络 所 需要 的 时 间 。 我 们 
可 以 简单 地 说 ， 宽 度 是 数据 包 大 小 与 网 络 接口 带宽 比值 的 一 阶 近似 。 例 如 ， 如 果 你 有 一 个 吉 
比特 / 秒 的 全 双 工 网 络 接口 ， 数 据 包 的 大 小 是 1000 字 节 ， 则 每 个 数据 包 的 宽度 是 8 微 秒 。 宽 
度 很 重要 ， 因 为 它 能 告诉 我 们 在 一 个 RTT 时 间 内 能 发 送 多 少数 据 包 。 换 句 话 说， 数据 包 的 宽 
度 为 我 们 提供 了 窗口 大 小 的 上 限 ， 即 在 给 定 的 RTT 时 间 内 所 能 发 送 的 数据 包 数 量 。 例 如 ， 如 
SE RTT 是 2 毫秒 ， 则 最 大 的 窗口 大 小 是 250 个 数据 包 (每 个 数据 包 有 1000 F), 假设 ACK 
包 的 宽度 可 以 忽略 不 计 。 因 为 以 下 几 种 原因 ， 实 际 选 择 的 窗口 大 小 可 能 会 小 于 这 个 上 限 。 这 
些 原因 包括 网 络 拥塞 (我们 之 前 在 本 节 讨 论 过 )、 发 送 端 和 接收 端的 缓冲 区 大 小 、 包 头 中 用 于 
表示 数据 包 序 号 的 字段 的 大 小 。 我 们 将 在 13.12 节 更 详细 地 讨论 消息 传输 时 间 。 


日 “这 张 经 过 许可 的 图 片 改编 自 一 张 相 似 的 图 片 ， 源 自 Kurose 和 Ross 的 书 ,《 Computer Networking: A Top 


Down Approach Featuring the Internet ), Addison-Wesley [Kurose, 2006]. 
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在 图 13-15 中 ， 只 要 收 到 活动 窗口 中 的 第 一 个 红色 数据 包 的 ACK， 活 动 窗 口 就 向 右 移动 
一 步 (第 一 个 日 色 数 据 包 变 成 蓝 色 数据 包 )。 随 着 时 间 的 推移 ， 活 动 窗口 会 (从 左 至 右 ) 划 过 
整个 序号 空间 ， 因 此 我 们 将 此 称 为 滑动 窗口 协议 ( sliding window protocol)。 讨 论 中 的 序号 是 
单调 递增 的 ， 但 在 实际 实现 中 序号 空间 是 循环 的 ， 会 从 0 重新 开始 。 





不 断 增长 的 序号 





序号 的 活动 窗口 





| 发 送 数 据 包 并 得 到 确认 | 
-活动 窗口 中 的 数据 包 可 

| [ekuse | 
情况 下 发 送 


图 13-15 滑动 窗口 协议 的 活动 窗口 (窗口 大 小 =10 ) 


数据 包 不 能 发 送 ， 因 为 它们 在 
活动 窗口 外 面 


一 条 消息 有 10 个 数据 包 ， 已 知 RTT 时 间 是 2 毫秒 。 假 设 发 送 数据 包 和 接收 ACK 的 时 间 与 介 
质 中 的 传播 时 间 相 比 可 以 忽略 不 计 ， 且 没有 发 生 数据 包 丢 失 。 那 么 窗口 大 小 为 5 的 滑动 窗口 协议 需要 多 























少时 间 来 完成 数据 传输 ? 
答 : 
下 图 展示 了 完成 传输 的 时 间 轴 : 
2 毫秒 
完成 传输 的 总 时 间 
发 送 端 的 时 间 轴 


在 本 例 中 ，RTT=2 ms。 发 送 端 先 发 送 一 个 5 个 数据 包 的 窗口 ， 然 后 开始 等 待 ACK。 发 送 端 会 在 发 
送 第 一 个 数据 包 的 2 毫秒 后 收 到 第 一 个 ACK， 即 在 2 毫秒 的 周期 (RTT) 内， 发送 端 已 经 成 功 完成 了 这 5 
个 数据 包 的 传输 (由 于 我 们 忽略 除 介质 中 的 传播 时 间 以 外 的 其 他 所 有 时 间 )。 所 以 完成 数据 传输 只 需要 两 
个 这 样 的 周期 。 消 息 传输 的 总 时 间 =2 X RTT=2 X 2 ms=4 ms. 


我 们 可 以 看 到 ， 所 选 的 窗口 大 小 指定 了 任意 时 刻 处 于 传输 中 的 数据 包 的 最 大 数量 。 例 如 ， 
如 果 在 例 13-4 中 我 们 需要 发 送 12 个 数据 包 ， 而 不 是 10 个 ， 则 需要 3 个 周期 来 传输 数据 。 最 
后 2 个 数据 包 将 在 第 3 个 周期 中 传送 ， 完 成 消息 传输 。( 我 们 会 在 习题 中 看 到 例 13-4 的 变 体 。) 

一 种 传输 协议 中 经 常 使 用 的 减少 ACK 包 的 优化 是 ， 累 积 数据 包 的 确认 ， 并 发 送 累 积 
ACK。 这 个 想法 非常 简单 和 直观 。 发 送 端 在 等 待 ACK 之 前 发 送出 一 个 窗口 的 数据 包 ， 因 此 
接收 端 会 收 到 n 个 序号 连续 的 数据 包 。 我 们 可 以 只 发 送 第 n 个 数据 包 的 ACK， 而 不 是 为 每 个 
数据 包 发 送 一 个 ACK。 协 议 的 语义 允许 这 样 的 优化 ， 因 为 收 到 第 n 个 数据 包 的 ACK 就 表示 
之 前 的 n-1 个 数据 包 已 经 成 功 送 达 。TCP 使 用 这 样 的 累积 ACK， 以 减少 网 络 传输 的 开销 。 

就 像 我 们 之 前 提 到 的 ，( 数 据 或 ACK) 数据 包 可 能 会 丢失 。 在 这 种 情况 下 ， 发 送 端 和 接收 
端 都 分 别 准备 好 重 传 丢 失 的 数据 包 或 ACK 包 。 传输 协议 使 用 超时 机 制 来 发 现 丢 失 的 数据 包 。 
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基本 的 思想 是 每 器 发 送 一 个 数据 包 ， 就 设置 一 个 计时 句 。 例 如 ， 如 果 发 送 端 在 超时 期 限 内 没 


有 收 到 数据 包 的 ACK， 就 将 重 传 这 个 数据 包 。 发 送 端 自然 需要 缓冲 还 没有 收 到 确认 的 数据 包 
(图 13-15 中 的 红色 部 分 )。 

在 设计 滑动 窗口 协议 时 ， 有 许多 细节 问题 需要 人 解决。 我们 已 经 提 到 了 缓冲 和 超时 重 传 。 
其 他 的 细节 问题 包括 : 

。 选择 合适 的 超时 时 间 。 

。 选择 合适 的 窗口 大 小 。 

o 处 理 乱 序 到 达 的 数据 包 。 

o 决定 什么 时 间 对 数据 包 进 行 确认 ， 包 括 发 送 一 组 数据 包 的 累积 确认 并 移动 活动 窗口 ( 参 

见 本 章 末 尾 的 练习 23 )。 

这 些 细节 在 我 们 的 讨论 范围 之 外 ， 留 给 更 深入 的 计算 机 网 络 课程 。9 
假设 网 络 中 平均 每 5 个 数据 包 会 有 1 个 丢 包 ， 对 于 一 条 包含 125 个 数据 包 的 消息 ， 计 算 发 送 
端 要 完成 消息 传输 所 需要 发 送 的 数据 包 总 数 。 

答 : 

我 们 可 以 预计 125 个 数据 包 会 丢失 20%( 1/5), N25 个 数据 包 。 当 我 们 重新 发 送 这 25 个 数据 包 时 ， 
预计 会 丢失 5 个 数据 包 ， 以 此 类 推 。 


发 送 的 数据 包 ER 成 功 
125 25 100 
25 5 20 
5 1 4 
| 0 al 
156 125 


完成 消 息 传 输 所 发 送 的 数据 包 总 数 =‘ 56. 


13.6.4 ”处 理 传输 错误 


首先 ， 接 收 端 要 能 够 检查 数据 包 在 传输 过 程 中 是 否 出 错 。 因 此 发 送 端 会 依据 数据 包 的 实 
际 内 容 计算 一 个 校 验 和 ( checksum)， 并 将 其 附加 到 数据 包 的 末尾 ， 以 使 接收 端 能 够 识别 出 错 
的 数据 包 。 校 验 和 的 计算 既 可 以 非常 简单 也 可 以 非常 复杂 。 例如， 因特网 中 的 校 验 和 一 般 都 
是 简单 地 计算 数据 字 节 的 和 ( 视 为 16 位 整数 )。 接 收 端 对 数据 做 同样 的 计算 ， 并 对 比 计算 结 
果 与 数据 包 中 的 校 验 和 ， 以 识别 出 错 的 数据 包 。 还 可 以 使 用 纠 错 码 ( Error Correcting Codes, 
ECC) 来 检测 数据 包 ， 并 修复 出 错 的 数据 包 。 这 些 讨论 同样 也 留 给 更 深入 的 计算 机 网 络 诬 程 。 
无 论 如 何 ， 如 果 一 个 数据 包 损 坏 到 无 法 修复 ,仍然 等 价 于 数据 包 丢 失 。 传 输 层 有 识别 错误 并 
采取 纠正 措施 的 责任 。 前 向 纠 错 (Forward Error Correction, FEC) 具有 修复 数据 包 的 能 
但 它 并 不 能 够 保证 修复 成 功 。 因 此 ， 传 输 协 议 必须 要 依靠 超时 重 传 来 处 理 传输 错误 。 

有 趣 的 是 ， 在 本 节 讨 论 传输 协议 时 ， 数 据 包 的 大 小 是 唯一 被 使 用 的 网 络 特 定 信息 。 换 名 
话说 ， 传 输 协议 规范 抽象 出 网 络 本 身 的 详细 人 信息。 因此， 协议 栈 中 的 传输 层 提 供 了 在 本 方 中 
说 明 的 所 有 功能 。 


O 关于 这 些 问 题 的 详细 讨论 ， 参 见 Kurose 和 Ross 的 书 ,《 Computer Networking: A Top Down Approach 
Featuring the Internet ), Addison-Wesley [Kurose, 2006]. 
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13.6.5 ”因特网 上 的 传输 协议 


因特网 上 使 用 的 传输 协议 可 以 分 为 两 大 类 : 面向 连接 的 ( connection-oriented) 和 无 连接 
的 (connection-less), TCP 是 前 者 的 例子 ， 而 UDP 是 后 者 的 例子 。 

TCP TCP 需要 首先 建立 端 到 端的 连接 。 在 连接 建立 后 ， 两 端 之 间 的 实际 数据 流 是 字 节 流 
(stream), Bl TCP 处 理 字 节 流 而 不 是 消息 。 例 如 ， 假 如 你 使 用 Web 浏览 器 向 CNN 请 求 一 个 网 
页 ，Web Ml hint CNN 的 (或 其 代理 ) Web 服务 器 创建 一 个 TCP 连接 。 一 旦 连接 成 功 ， 客 
户 端 会 完 发 送 一 系列 请 求 ， 服 务 右 在 响应 后 会 回 送 网 页 中 的 一 系列 对 象 。 对 TCP 传输 来 说 客户 
闪 和 服务 硕 之 间 的 请 求 和 响应 就 是 字 节 流 。 当 整个 网 页 传输 完 后 ， 双 方 将 拆除 连接 。 

TCP 连接 是 一 种 全 双 工 ( full duplex) 连接 ， 即 在 连接 建立 后 ， 两 端 可 以 同时 发 送 和 接收 
数据 。 虽 然 连 接 是 由 一 端 发 起 建立 的 ， 但 建立 的 连接 是 对 称 的 。TCP 主要 提供 了 以 下 几 种 功 
能 来 促使 两 端 之 间 的 信息 流传 输 : 

。 建立 连接 : 在 这 个 阶段 ， 两 端 使 用 三 次 握手 来 协商 传输 的 初始 序号 。 

图 客户 问 同 服务 咒 发 送 连 接 请 求 消息 (有 一 个 特殊 字段 表明 它 是 连接 请 求 )， 其 中 包含 
客户 端 计划 在 发 送 数 据 包 时 使 用 的 初始 序号 。 

图 服务 硕 发 送 对 连接 请 求 的 确认 消息 (同样 有 一 个 特殊 字段 表明 它 是 建立 连接 的 三 次 
握手 的 一 部 分 )， 其 中 包含 服务 器 计划 在 发 送 数据 包 时 使 用 的 初始 序号 。 

图 客户 端 分 配 资源 (数据 包 窗 口 缓冲 区 、 重 传 定时 器 等 )， 并 发 送 确认 消息 (这 是 三 次 
握手 中 的 最 后 一 步 )。 当 服务 器 收 到 此 次 确认 后 ， 就 会 为 这 次 连接 分 配 资源 (数据 包 
窗口 缓冲 区 、 重 传 定 时 器 等 )。 

此 时 ， 新 建立 的 TCP 连接 的 客户 端 与 服务 器 已 经 准备 好 交换 数据 了 。 

。 可 靠 的 数据 传输 : 在 这 个 阶段 ， 两 端 都 可 以 发 送 和 接收 数据 。 协 议 保证 从 上 层 传 递 下 

来 的 数据 会 被 如 实地 按 序 传递 给 接收 端 ， 没 有 任何 的 数据 丢失 或 损坏 。 

。 拥塞 控制 : 在 数据 传输 阶段 ， 发 送 端 也 会 通过 观察 网 络 拥塞 状况 来 自行 动态 调整 窗口 

大 小 以 避免 路 由 器 队列 堆积 (从 而 缓解 网 络 拥 塞 ， 详 见 13.6.3 节 )。 因 为 这 个 原因 ，TCP 

数据 流 在 网 络 拥塞 时 可 能 会 遭遇 无 上 限 的 延迟 。 这 会 给 需要 保障 的 实时 传输 带 来 问题 。 

尽管 有 这 个 内 在 问题 , 但 由 于 它 的 普遍 性 和 可 靠 性 ，TCP 也 用 于 许多 实时 的 数据 流传 输 。 
© 拆除 连接 : 在 这 个 阶段 ， 两 端 将 按 下 列 步 骤 断 开 连 接 。 

图 客户 端 向 服务 器 发 送 拆除 连接 的 请 求 (有 一 个 特殊 字段 表明 它 是 拆除 连接 请 求 )。 服 
务 硕 回复 一 个 ACK. 

图 服务 器 向 客户 端 发 送 它 自己 的 拆除 连接 请 求 ( 有 一 个 特殊 字段 表明 它 是 拆除 连接 请 
求 )。 客 户 端 回复 一 个 ACK， 并 释放 与 此 连接 相关 的 客户 端 资 源 。 当 收 到 ACK 后 ， 
服务 器 释放 与 此 连接 相关 的 服务 器 资源 。 连 接 正 式 关 闭 。 

虽然 在 讨论 中 假定 由 客户 端 发 起 拆除 ， 但 无 论 客户 端 还 是 服务 器 都 能 够 发 起 连接 拆除 。 
在 连接 拆除 过 程 中 ， 此 连接 不 会 传输 新 的 数据 。 但 是 在 连接 关闭 前 ， 所 有 之 前 传输 的 数据 确 
保 已 经 被 可 靠 交 付 。 

UDP UDP 位 于 IP 之 上 上， 为 应 用 程序 提供 不 可 靠 的 数据 报 服 务 。 正 如 我 们 之 前 所 看 到 
的 ，TCP 是 面向 流 的 ， 在 实际 的 数据 通信 开始 之 前 需要 在 两 端 之 间 使 用 复杂 的 握手 来 建立 连 
接 。 同 样 ， 在 通信 完成 之 后 也 需要 使 用 复杂 的 握手 来 关闭 连接 。 此 外 ，TCP 还 拥有 一 些 高 级 
功能 (如 确认 、 滑 动 窗口 和 拥塞 控制 ) 来 确保 在 广域网 中 的 可 靠 传 输 ， 并 坚持 公平 原则 与 其 
他 用 户 共 享 可 用 带宽 。 这 些 高 级 功能 给 通信 带 来 了 开销 。 因 此 ， 可 以 在 弱 保 障 下 充分 发 挥 作 


用 的 应 用 程序 (如 寄 一 张 明 信 片 ) 会 使 用 UDP， 因 为 它 更 简单 、 速 度 更 快 。 例如， 对 IP 电话 
(Voice over IP, VoIP) 来 说 ， 数 据 包 的 到 达 延 时 远 比 丢 失 几 个 数据 包 更 为 重要 (由 于 实时 限制 ， 
没有 时 间 用 于 恢复 丢失 或 损坏 的 数据 包 )。 因 此 UDP 被 越 来 越 广泛 地 使 用 ， 当 前 估计 20% 的 
因特网 流量 都 使 用 UDP 协议 。 

“OX, UDP 也 有 一 些 缺 点 : 消息 可 能 会 乱 序 到 达 ; 消息 可 能 会 丢失 ; 没有 自我 调节 机 制 。 
所 以 UDP 流量 很 可 能 是 网 络 拥塞 增长 的 源头 。 类 似 于 TCP，UDP 不 提供 任何 保障 (例如 ， 延 
迟 上 限 或 传输 速率 下 限 )。 表 13-1 总 结 了 TCP 和 UDP 的 优点 与 缺点 。 


表 13-1 TCP 和 UDP 的 比较 


传输 协议 缺点 













TCP 面向 连接 的 ; 拥塞 控制 ; 基于 | 可 靠 ; 消息 按 顺 序 到 达 ; 行为 | 建立 和 拆除 连接 复杂 ; 竞争 处 于 
数据 流 ; SCRA fai Al ACK 展 好 ， 能 缓解 网 络 拥塞 劣势 ; 没有 延迟 或 传输 速率 保障 
UDP 无 连接 的 ; 无 拥塞 控制 ; 基于 | 简单 ; 朴实 ; 特别 适合 不 易 丢 | 不 可 靠 ; 乱 序 到 达 ; 可 能 导致 


数据 报 ; 无 滑 窗 和 ACK 包 的 环境 和 容忍 丢 包 的 应 用 程序 | 网络 拥塞 ; 没有 延迟 或 传输 速率 
保障 


之 前 的 讨论 听 起 来 是 说 ， 需 要 实时 保障 的 网 络 应 用 程序 既 不 能 使 用 UDP， 也 不 能 使 用 
TCP。 事 实 上 ， 这 并 不 完全 正确 。 实 时 应 用 程序 的 开发 人 员 会 考虑 这 些 协 议 所 拥有 【或 缺 
乏 ) 的 功能 ， 以 使 用 户 体验 不 会 受到 负面 影响 。 例 如 ， 音 频 或 视频 服务 的 应 用 程序 会 在 开始 
播放 之 前 就 缓冲 几 分 钟 的 内 容 。 此 外 ， 它 们 还 能 够 动态 地 增加 缓冲 区 容量 ， 以 应 对 网 络 拥 
塞 和 满足 应 用 程序 指定 的 服务 质量 保障 。 表 13-2 列 出 了 部 分 网 络 应 用 程序 以 及 它们 所 使 用 
的 传输 协议 。 

表 13-2 网 络 应 用 程序 和 传输 协议 


应 用 程序 关键 需求 传输 协议 


Web 浏览 器 可 靠 的 消息 传输 ; 消息 顺序 到 达 TCP 


























即时 通信 可 靠 的 消息 传输 ; 消息 顺序 到 达 TCP 

IP 电话 通常 是 UDP 

电子 邮件 TCP 

文件 传输 可 靠 的 消息 传输 ; 消息 顺序 到 达 TCP 

网 络 视频 通常 是 UDP， 可 能 是 TOP 

P2P 网 络 上 的 文件 下 载 可 靠 的 消息 传输 ; 消息 顺序 到 达 TCP 

局 域 网 网 络 文件 服务 可 靠 的 消息 传输 ; 消息 顺序 到 达 TCP; 或 基于 UDP 的 可 靠 传输 
可 靠 的 消息 传输 ; 消息 顺序 到 达 TCP 


远程 终端 访问 


13.6.6 ”传输 层 总 结 


一 般 情 况 下 ， 操 作 系 统 支持 多 个 协议 族 ， 以 满足 不 同 应 用 程序 的 通信 需求。 在 20 世纪 
80 年 代 早 期 ，ISO 标准 组 织 提 出 了 一 套 新 的 传输 协议 ， 称 作 OSI 传输 层 协 议 (ISO-Transport 
Protocol， 从 TPO 到 TP4)， 作 为 网 络 通 信和 的 可 能 标准 。 然 而 ， 为 无 处 不 在 的 TCP, 
TPO ~ TP4 从 来 没有 被 真正 启用 过 。 尽 管 当前 在 网 络 社区 中 有 人 担心 TCP 不 再 适合 因特网 传 
输 ， 但 已 经 有 太 多 的 网 络 应 用 程序 使 用 TCP 协议 ， 它 也 很 难 被 其 他 协议 所 替换 。 

但 是 ， 谁 也 不 知道 明天 究竟 会 是 什么 样 。 例 如 ，GENI (Global Environment for Network 
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Innovation, ERM 248 HALE) 和 PlanetLab 9 等 全 球 网 络 基础 研究 项 目 可 能 会 作为 变革 的 推 
动 者 ， 为 网 络 上 不 同类 型 的 应 用 程序 带 来 更 新 、 更 好 的 网 络 协议 。 

我 们 对 于 传输 协议 这 个 迷人 的 领域 只 给 出 了 一 份 简要 的 介绍 ， 你 能 够 在 更 深入 的 计算 机 
网 络 评 程 中 学 习 到 与 这 些 协议 相关 的 更 多 知识 。 


13.7 网络 层 


咋 一 看 ， 网 络 层 的 作用 似乎 简单 而 直接 一 一 将 从 传输 层 传送 来 的 数据 包 发 送 到 目的 地 ， 
并 将 从 目的 地 传送 来 的 数据 包 传送 给 传输 层 (上 层 协议 栈 )。 这 个 功能 也 可 以 捆绑 到 传输 层 
中 ， 但 这 不 会 是 一 个 好 主意 。 第 一 ， 考 虑 你 的 笔记 本 电脑 或 家 用 计算 机 上 有 多 少 不 同 的 网 络 
连接 。 至 少 你 可 能 会 有 一 个 有 线 连 接 和 一 个 无 线 连接 。 因 此 ， 通常 不 同 的 目标 主机 需要 通过 
不 同 的 网 络 连 接 来 访问 。 第 二 ， 看 图 13-6， 源 与 目的 地 可 能 不 是 直接 相连 的 ， 因 此 数据 包 可 
能 需要 通过 多 跳 才 能 到 达 目 的 地 。 这 些 网 络 的 中 间 跳 不 需要 提供 传输 层 的 功能 ， 因 为 中 间 节 
点 只 是 简单 地 加 目的 地 转发 数据 包 。 第 三 ， 由 于 我 们 无 法 控制 网 络 的 变化 ， 所 以 数据 包 从 源 
到 达 目 的 地 实际 所 经 过 的 路 线 ， 也 称 作 路 由 (route)， 是 不 固定 的 。 结 论 是 ， 应 该 由 协议 栈 
中 一 个 不 同 的 协议 层 来 决策 如 何 最 好 地 将 一 个 数据 包 传 送 到 目标 主机 ， 我 们 把 实现 了 这 个 功 
能 的 协议 层 称 作 网 络 层 。 这 样 的 责任 分 离 使 传输 层 能 够 独立 于 任何 网 络 连接 添加 /删除 操作 。 
传输 层 和 网 络 层 之 间 的 接口 确定 目的 地 址 和 数据 包 大 小 等 参数 。 网 络 层 负责 依据 给 定 的 目 
标 地 址 来 路 由 数据 包 ， 为 此 它 会 维护 一 张 包含 从 源 到 任意 期 望 的 目标 主机 的 路 由 或 路 径 的 表 
( 称 为 路 由 表 )。s 当 网 络 层 从 线路 中 收 到 一 个 数据 包 时 ， 它 向 最 终 目的 地 转发 该 数据 包 ， 或 者 
如 果 此 节点 是 数据 包 的 目的 地 ， 就 将 其 传送 给 传输 层 。 

下 面 是 网 络 层 所 需要 的 功能 : 

。 路 由 算法 (routing algorithm): 网 络 层 需要 决定 从 源 回 目的 地 传输 数据 包 的 路 由 。 用 于 

确定 路 由 的 算法 称 为 路 由 算法 ， 这 是 网 络 层 的 主要 功能 。 在 本 市 中 ,我 们 将 癌 读 者 介 

绍 一 些 在 因特网 中 广泛 使 用 的 著名 路 由 算法 。 

。 服务 模式 (service model): 网 络 层 需要 以 现 有 的 路 由 信息 为 基础 ， 将 从 输入 链 路 到 达 

的 数据 包 转 发 给 合适 的 输出 链 路 。 这 通常 也 称 作 网 络 层 的 交换 (switching) 功能 。 这 个 

功能 非常 依赖 于 协议 栈 上 层 向 网 络 层 提供 的 服务 模式 。 在 本 节 中 ， 我 们 将 讨论 网 络 中 ， 

尤其 是 因特网 中 ， 著 名 的 交换 策略 和 服务 模式 。 

执行 网 络 层 功 能 的 设备 称 为 路 由 器 。 对 于 本 节 所 讨论 的 路 由 算法 来 说 ， 路 由 需 与 终端 主 
机 没有 特殊 的 区 别 ， 唯 一 的 区 别 是 路 由 器 知道 它 不 是 数据 包 的 终端 主机 。 路 由 需 中 的 协议 栈 
只 包含 了 物理 层 、 链 路 层 和 网 络 层 。 


13.7.1 路 由 算法 


网 络 是 主机 和 路 由 器 的 集合 体 ， 其 中 每 台 设备 都 有 其 独特 的 身份 标识 。 在 因特网 世界 中 ，， 
身份 标识 是 一 个 唯一 的 耳 地 址 。 如 果 网 络 是 全 连接 的 ， 假 定 在 任意 两 个 节点 之 间 传 输 一 个 数 
据 包 的 开销 是 完全 一 致 的 ， 则 任意 源 的 数据 包 都 可 以 经 由 一 跳 路 由 到 达 任 意 目的 地 。 然 而 ， 


© PlanetLab 是 一 个 实验 性 的 网 络 测试 床 ， 拥 有 世界 各 地 贡献 的 网 络 节点 ， 为 了 方便 在 广域网 中 进行 受 控 实 验 
而 建立 。 参 见 http://www.planet-lab.org/。 

© £13.74, 我们 将 看 到 网 络 层 中 还 有 另 一 张 转发 表 (forwarding table)， 它 包含 了 数据 包 向 目标 地 址 路 
由 所 必须 经 过 的 下 一 跳 。 
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EMH, (a) 网络 不 是 全 连接 的 ;(b) 在 任意 两 个 节点 之 间 传 输 一 个 数据 包 的 开销 可 能 是 不 
一 致 的 。 让 我 们 先 了 解 这 里 所 说 的 开销 (cost) 究竟 是 什么 意思 。 上 归根结底 ， 我 们 的 目标 是 以 
最 小 的 延迟 将 数据 包 从 A 点 传输 到 B 点 。 开 销 可 以 认为 是 一 个 汇总 了 两 点 之 间 的 数据 包 传 输 
延迟 (这 取决 于 连接 的 带宽 ) 与 网 络 流量 的 
量化 指标 。 拿 开车 上 下 班 做 比喻 ， 上 下 班 
的 开销 (即行 程 时 间 ) 取决 于 途中 的 车 速 限 
制 与 交通 流量 。 特 别 是 ， 在 上 下 班 的 高 峰 
期 开销 会 更 高 。 有 时 选择 一 条 较 长 的 路 线 
会 更 加 划算 ， 能 够 在 较 短 的 时 间 内 到 达 目 
的 地 。 

Dijkstra 链 路 状态 路 由 算法 图 13-16 
使 用 图 来 表示 网 络 ， 图 中 每 个 顶点 代表 一 
台 主 机 ， 而 边 代 表 主 机 之 间 有 可 用 的 物理 
链 路 。 我 们 定义 一 个 节点 的 链 路 状态 为 它 
到 相 邻 节点 的 传输 开销 。 例 如 ， 在 图 13-16 
中 ， 节 点 4 的 链 路 状态 为 {B:2, C:1, D:4, 
E:5}。 即 ， 从 4 到 B 有 2 个 单位 的 传输 开 
销 ， 从 4 到 C 有 1 个 单位 的 开销 ， 从 4 到 也 有 4 个 单位 的 开销 ， 从 4 到 EE 有 5 个 单位 的 开 
销 。 同 样 ，B 的 链 路 状态 为 {4:2，C:2，E:1}， 以 此 类 推 。 

(Dijkstra) 链 路 状态 (Link State, LS) 路 由 算法 是 使 用 全 局 信息 的 局 部 算法 。 即 网 络 中 的 
所 有 节点 都 拥有 完整 的 网 络 状 态 信 息 (例如 ， 连 通 性 和 链 路 开销 )。 每 个 节点 可 以 在 本 地 运行 
此 算法 ， 根 据 全 局 信息 来 决定 向 目的 地 发 送 数据 包 的 最 佳 路 由 。 网 络 中 的 每 个 节点 从 它 的 相 
邻 节 点 获取 信息 ， 因 此 每 个 节点 周期 性 地 将 它 的 链 路 状态 广播 给 相 邻 节点 。 

这 个 算法 通过 迭代 寻找 一 个 节点 到 网 络 中 其 他 节点 的 最 短路 径 。 算 法 的 每 次 迭代 确定 到 
一 个 节点 的 最 短路 由 。 因 此 ， 如 果 网 络 中 共有 nn 个 节点 ， 此 算法 需要 进行 nl 次 迭代 来 确定 
到 所 有 其 他 节点 的 最 短路 由 。 

这 个 算法 的 原理 非常 简单 。 开 始 时 ， 你 知道 从 4 到 其 相 邻 节点 (B, C, D, E) 的 开销 ， 
其 中 4-C 是 开销 最 小 的 路 由 (1 个 单位 )。4-D 的 直接 链 路 有 4 个 单位 的 开销 ， 但 是 如 果 我 们 
先 通过 开销 最 小 的 链 路 4-C， 则 A 到 D 只 需要 3 个 单位 的 开销 (A-C, C-D). 

在 算法 开始 执行 时 ， 我 们 知道 4 到 其 相 邻 节点 的 开销 ， 每 次 迭代 我 们 将 增加 一 条 从 4 到 
其 他 新 节点 的 最 短路 由 。 例 如 ， 在 第 一 次 迭代 中 ,我 们 依据 4 的 链 路 状态 确定 了 一 条 最 短路 
是 4_C。 在 第 二 次 迭代 中 ,我 们 依据 4 与 已 经 发 现 的 最 短路 由 来 确定 到 达 新 节点 的 一 条 新 的 
最 短路 由 。 算法 一 直 进行 迭 代 直 到 确定 所 有 的 最 短路 由 。 示 例 中 有 6 个 节点 ， 因 此 算法 需要 
执行 5 次 迭代 。 

表 13-3 概述 了 图 13-16 中 的 示例 执行 算法 所 得 到 的 结果 。 在 表 的 每 行 中 ， 第 二 列 高 亮 的 
节点 是 此 次 迭代 中 确定 的 最 短路 由 的 终点 。 例 如 ， 在 迭代 1 中 最 短路 由 为 4-C。 粗 体 路 由 为 
由 于 新 发 现 的 最 短路 由 而 被 更 新 的 部 分 。 例 如 ， 到 D、E、F 的 路 由 会 在 迭代 1 更新， 而 到 8B 
的 路 由 保持 不 变 。 





图 13-16 一 个 示例 网 络 。 顶 点 代表 主机 ， 边 代表 链 
路 ， 边 上 数字 表示 主机 之 间 的 传输 开销 
(延迟 ) 


R 13-3 Dijkstra 算法 对 于 图 13-16 中 图 的 计算 操作 。 在 每 次 迭代 中 ， 
我 们 根据 开销 来 选择 最 好 的 下 一 跳 9 


ERRE ET 
F : 
TABEF V 


后 面 是 Dijkstra 的 LS 路 由 算法 的 伪 代 码 ， 我 们 使 用 图 13-16 中 的 信息 来 进行 非 形式 化 的 
描述 。 在 此 算法 中 我 们 使 用 了 下 列 符 号 : 

。R 表示 从 A 开始 的 最 短路 由 的 已 知 节 点 集合 。 

。]ink-state (X: value) 表示 从 4 到 半 的 直接 链 路 开销 。 

。 cost (4->X) 表示 A 到 的 路 由 开销 。 

e route (4->X) 表示 从 A 至 的 路 由 ， 可 能 会 经 过 算法 已 经 发 现 的 中 间 方 点。 


ai Pil wln;]; — 


Init: 
R = {A} // set of nodes for which route from A known 
cost(A — X) = link-state(X: value) for all X adjacent to A 


cost(A — X) = « for all X not adjacent to A 

// let n be the number of nodes in the network 

for (i = 1 to n- 1) { 

choose node X not in R whose cost(A — X) is a minimum; 
add X to R; 
set route(A — X) as the least-cost route from A to X; 
update routes for nodes adjacent to X: 
for each Y not in R and adjacent to X { 
cost(A — Y) = MIN(original cost(A — Y), 
cost(A — X) + cost(X — Y)); 
set route(A — Y); // only if new route 
// through X is lower cost 
} 

} 

链 路 状态 算法 也 称 为 Dijkstra 最 短路 径 (shortest-path) 算法 。 这 个 算法 除了 每 个 节点 都 需 
要 拥有 全 局 信息 外 ， 另 一 个 问题 是 该 算法 假设 网 络 中 的 所 有 节点 能 够 同步 执行 算法 ， 这 样 每 
个 节点 才能 计算 出 相同 的 最 短路 径 。 在 实际 中 ， 这 个 要 求 很 难 实现 ， 各 个 路 由 需 与 各 个 主机 
会 在 不 同 的 时 间 执 行 算法 ， 这 可 能 会 导致 路 由 决策 中 的 某 些 不 一 致 。 尽 管 会 出 现 这 种 暂时 的 
不 一 致 性 ， 但 有 扩展 算法 能 够 保证 网 络 稳定 。 这 些 扩展 超出 了 本 书 的 讨论 范围 。 

距离 矢量 算法 (distance vector algorithm) 另 一 种 在 因特网 中 广泛 使 用 的 路 由 算法 是 距离 
矢量 (DV) 算法 。 这 个 算法 是 一 个 异步 算法 ， 且 只 需要 网 络 链 路 状态 的 部 分 知识 。 由 于 因 特 
网 不 断 演变 的 性 质 ， 这 两 个 属性 使 得 距离 矢量 算法 非常 适合 于 因特网 。 

这 个 算法 的 基本 思想 很 简单 。 无 论 最 终 目 标 是 什么 ,任何 节点 都 只 需要 决定 它 将 数据 包 
传输 给 哪 一 个 有 物理 链 路 直接 连接 的 相 邻 节点 。 对 于 相 邻 节点 的 选择 非常 简单 ， 每 次 选择 当 
前 最 短路 由 的 后 续 节 点 。 例 如 ， 参 考 图 13-16， 如 果 瑟 希望 向 也 发 送 一 个 数据 包 ， 它 会 在 它 


的 所 有 邻居 (A, B, C, F) 之 中 选择 下 作为 下 一 跳 。 为 什么 呢 ? 因为 如 果 我 们 直接 看 图 13- 


O 此 表 有 不 关键 的 错误 5/ADF-4/ACDF。 一 一 译 者 注 
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16， 我 们 能 够 立刻 发 现下 拥有 到 DD 的 最 短路 由 。 值 得 注意 的 是 ,E 做 出 决定 所 需要 的 并 不 是 到 
达 D 的 实际 路 由 ， 它 只 宕 要 知道 它 的 相 邻 方 点 到 D 所 需要 的 开销 。 

每 个 厄 点 维护 一 张 路 由 表 ， 称 为 距离 矢量 表 。 这 张 表 记 录 了 通过 每 一 个 物理 连接 的 相 邻 
节点 ， 能 够 到 达 每 个 目的 地 的 最 短路 由 。 距 离 失 量 这 个 名 字源 于 每 个 节点 都 有 一 个 通过 相 邻 
节点 到 达 目 的 地 的 开销 矢量 。 表 13-4 是 图 13-16 的 示例 网 络 中 节点 的 DV 表 。 每 行 表 示 通 
过 相 邻 节点 到 达 一 个 特定 目的 地 所 需要 的 最 短路 由 开销 。DYV 表 中 只 记录 开销 ， 但 为 了 方便 展 
示 ， 我 们 也 在 括号 中 补充 了 实际 的 路 由 。 我 们 应 该 明确 选择 下 一 跳 时 并 不 需要 实际 的 路 由 信 
县。 到 每 个 目的 地 的 最 短路 由 选择 显示 为 灰色 。 


表 13-4 节点 E 的 DV 表 。 每 行 表示 通过 相 邻 节点 到 达 一 个 特定 目的 地 所 需要 的 开销 ” 
通过 相 邻 节点 到 达 目的 地 的 开销 


coe | a | el ¢ |. + 


D 2 EFD) 
F LE 
我 们 对 构建 这 张 表 的 每 个 节点 的 DV 算法 只 给 出 非 形 式 化 说 明 。 每 个 节点 将 它 到 每 个 目 
的 地 的 最 短路 由 开销 发 送 给 其 相 邻 节点 ， 每 个 节点 使 用 这 个 信息 来 更 新 它 的 DV 表 。 当 满足 


656| 下 列 两 个 条 件 之 一 时 ， 一 个 节点 会 重新 计算 它 的 DV 表 项 。 

1 ) 节点 观察 到 相 邻 节点 的 链 路 状态 发 生 改 变 〈 例 如 ， 由 于 网 络 拥塞 ， 从 五 到 下 的 链 路 状 
ASM 1 变 成 5 )。 

2 ) 节点 从 相 邻 节点 收 到 了 最 短路 由 开销 的 更 新 。 

在 重新 计算 表 项 之 后 ， 如 果 有 任何 的 变化 ， 则 该 节点 将 这 个 改变 告诉 其 相 邻 节点 。DV 的 
数据 结构 和 算法 都 非常 简单 明了 。 我 们 把 编写 DV 算法 的 伪 代 码 作 为 一 道 习 题 留 给 读者 。 

与 Dijkstra 链 路 状态 算法 相 比 ， 我 们 立刻 就 能 够 看 到 这 个 算法 的 异步 特性 ， 以 及 只 使 用 
局 部 信息 的 性 质 。 网 络 的 状态 会 持续 地 改变 (例如 ， 当 前 网 络 流量 的 传输 模式 、 新 的 网 络 流 
量 、 增 加 /删除 节点 与 路 由 器 等 )。 我 们 可 能 会 怀疑 是 否 能 够 依据 不 断 改 变 的 当前 网 络 状态 来 
计算 路 由 。 幸 运 的 是 ， 这 些 算法 具有 良好 的 收敛 性 ， 能 够 确保 计算 路 由 的 速度 比 网 络 状态 的 
变化 速度 更 快 。 

随 着 时 间 的 推移 ， 因 特 网 上 出 现 了 更 多 的 高 效 路 由 算法 ,但 是 LS 算法 和 DYV 算法 仍然 在 
因特网 路 由 中 占据 主导 地 位 。 

分 层 路 由 (hierarchical routing) 读者 也 许 想 知道 LS 算法 或 DV 算法 如 何在 因特网 庞大 
的 规模 (超过 百 万 个 节点 ) 与 履 盖 范围 内 进行 路 由 。 这 两 个 算法 都 将 因特网 上 的 所 有 市 点 看 
成 是 对 等 节点 (peer)。 也 就 是 说 ， 网 络 这 个 单一 实体 中 的 所 有 节点 都 是 平等 的 。 这 种 局 平 结 
构 不 能 扩展 到 数 百 万 的 节点 上 。 当 任何 组 织 的 规模 超过 一 定 阔 值 后 ， 就 会 使 用 分 层 结构 来 管 
理 控 制 可 能 会 出 现 的 混乱 ， 因 特 网 也 使 用 相同 的 原则 。 对 于 因特网 庞大 的 规模 ， 需 要 进行 管 
理 控 制 是 使 用 分 层 结构 令 人 信服 的 理由 。 特 别 是 ， 在 当今 这 个 垃圾 邮件 不 断 增 加 的 时 代 ， 部 


白 “ 原 表 有 4 处 不 影响 结果 的 错误 ， 已 修正 。3(BA) 应 为 3(EBA) ; 6(EFDCB) 应 为 3(EFEB) ; 2(EBEF) 应 为 
3(EBEF); 7(ECBEF) 应 为 6(ECDF))。 译 者 注 
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( Autonomous System, AS) 能 够 很 好 
epee Be 18 Sf 同一 个 自治 系 [AMR 自 沿 系统 | ”不同 自治 系统 内 





地 解决 规模 和 管理 控制 这 两 个 问题 。 统 内 的 节点 进 内 的 路 由 之 间 的 路 的 节点 进行 通信 
在 一 个 AS 内 的 路 由 器 可 以 使 用 LS 或 行 通信 使 用 协议 ”由 协议 使 用 

DV 协议 来 为 AS 内 的 主机 进行 路 由 ， HE 

其 中 的 一 个 或 多 个 路 由 需 需 要 能 人 够 与 3 JZ 

AS 外 的 目标 通信 ， 这 些 路 由 器 称 为 O 链 路 层 。 | 第 2 层 

网 关 路 由 器 (gateway router)。 不 同 第 1 层 

AS 的 网 关 路 由 器 使 用 边界 网 关 协 议 ”图 13-17 网 关节 点 中 网 络 层 的 详细 信息 ， 它 至 少 需要 支 
(Border Gateway Protocol，BGP ) 进行 持 两 种 协议 ;一 个 用 于 AS 内 的 路 由 ， 另 一 个 
通信 。 一 个 AS 内 的 节点 不 会 关心 也 用 于 跨 AS 的 路 由 


不 能 影响 到 其 他 AS 内 节点 的 演变 /磨损 /扩展 。 

因此 ， 如 图 13-17 所 示 ， 网 关节 点 中 的 网 络 层 至 少 需 要 支持 两 种 协议 : 一 个 用 于 AS 内 通 
信 ， 一 个 用 于 AS 间 通 信 。 

参考 图 13-18， 设 想 连 接 到 路 由 器 C.1 的 主机 需要 与 连接 到 路 由 器 C.2 的 主机 进行 通信 。 
在 这 种 情况 下 ， 通 信和 是 通过 自治 系统 C 所 使 用 的 AS 内 协议 CLS. DV 或 其 他 变种 ) 进行 的 。 
再 设想 连接 到 路 由 器 4.4 的 主机 需要 向 连接 到 路 由 需 B.3 的 主机 发 送 数据 包 。 路 由 融 4.4 依据 
路 由 表 查 出 要 将 需要 送出 自治 系统 4 的 数据 包 发 送 给 A.G WRH AE 4.G 根据 路 由 表 知 道 ， 
BBA RIAA BPI TE A ASH, Te BORE eK BIN B.G WH at A.G 
使 用 BGP 协议 与 B.G 通信 ， 再 由 B.G 在 自治 系统 B 中 使 用 AS 内 协议 将 数据 包 有 效 地 路 由 到 
节点 B.3。 如 图 13-17 所 示 ， 路 由 器 4.G、B.G、C.G1 以 及 C.G2 各 自 都 有 一 个 协议 栈 ， 使 它 
们 能 够 与 各 自 的 自治 系统 内 的 节点 以 及 使 用 BGP 协议 的 其 他 自治 系统 的 网 关节 点 通信 。 





图 13-18 3 个 不 同 的 AS 依靠 AS 内 和 AS 间 协 议 共存 
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注意 ， 市 点 4.4 的 网 络 层 完 全 不 需要 知道 自治 系统 B 的 内 部 结构 ， 甚 至 4 的 网 关节 点 
A.G 也 不 知道 自治 系统 B 内 部 的 AS 内 协议 
BGP 协议 自身 的 细节 超出 了 本 书 的 范围 。9 


13.7.2 ”因特网 寻 址 


到 目前 为 止 ， 我 们 使 用 节点 这 个 术语 来 表示 主机 或 者 路 由 器 ， 但 是 主机 和 路 由 器 从 根本 
上 完全 不 一 样 。 正 如 我 们 之 前 所 提 到 的 ， 主 机 是 在 网 络 边缘 的 终端 设备 ， 通 常 只 通过 网 卡 
(NIC) 连接 到 网 络 。 而 路 由 器 〈 见 图 13-18 ) 允许 与 多 个 主机 连接 ， 它 作为 中 继 设备 将 每 个 连 
接 发 送 来 的 消息 路 由 到 通 往 预 期 目的 地 的 合适 连接 。 通 稼 ， 路 由 锅 的 网 卡 (NIC) 数量 与 它 所 
E 支 持 的 连接 数 一 样 。 处 于 网 络 边 缘 的 主机 同时 是 消息 的 生产 者 和 消费 者 。 因 此 ， 主 机 上 的 
协议 栈 包 含 了 13.4.1 节 所 讨论 的 所 有 5 个 层 ， 而 路 由 器 只 包含 了 协议 栈 的 底 三 层 ， 因 为 它 的 
预期 功能 是 作为 网 络 层 级 的 数据 包 路 由 需 。 
让 我 们 更 深入 地 了 解 因特网 寻 址 ， 以 便 理 解 主机 如 何 获取 网 络 地 址 ， 以 及 每 个 路 由 需 所 
,| 处 理 的 网 络 地 址 数量 。 你 已 经 听 说 过 IP 地 址 ,我们 很 快 就 会 看 到 ，IP 寻 址 是 一 个 为 任何 网 络 
659| ”设备 寻 址 的 相当 合乎 逻辑 的 方式 。 考 虑 美国 地 面 通信 的 电话 号 码 。 通 常 ， 一 个 城市 的 所 有 区 
域 都 拥有 相同 的 区 域 代码 (电话 号 码 的 前 3 个 数字 。 例 如 ， 亚 特 兰 大 地 区 分 配 到 的 区 域 代 码 
为 404、678 和 770 )。 随 后 的 3 个 数字 代表 特定 的 区 域 或 实体 (例如 ， 佐 治 亚 理工 学 院 分 配 
到 的 交换 代码 是 894 和 385 )。 最 后 的 4 个 数字 表示 特定 的 终端 设备 。 
因此 ， 电 话 号 码 是 一 个 多 部 分 地 址 ( 参 3 个 数字 3 个 数字 
见 图 13-19 )， 因 特 网 的 地 址 也 是 这 样 。 但 是 eee 
我 们 很 快 就 会 看 到 ， 不 同 于 电话 号 码 ， 卫 地 — 
址 不 具有 地 理 意义 。IP 地 址 的 多 部 分 性 质 实 图 13-19 EYAL To A 
质 上 是 一 种 支持 网 络 分 层 寻 址 的 机 制 。IP 地 址 (IPv4 ©) Æ 32 位。 连接 到 因特网 的 每 个 接口 
都 需要 有 一 个 全 球 唯一 的 IP 地址 。 因 此 ， 如 果 你 的 笔记 本 电脑 同时 有 因特网 的 无 线 连接 和 有 
线 连 接 ， 它 们 会 有 各 自 独 立 的 IP 地 址 。 同 样 ， 连 接 各 部 分 独立 网 络 的 路 由 需 的 每 个 网 络 接口 
都 有 唯一 的 IP 地 址 。32 位 的 IP 地址 由 4 部 分 组 成 ， 通常 使 用 点 分 十 进 制 (dotted decimal) 表 
示 法 来 表示 。 例 如 ，p.g.rs， 其 中 p、g、r、s 都 是 8 位 的 数值 。 考 虑 IP 地 址 128.61.23.216。 
其 中 的 每 个 数值 都 是 相应 的 8 位 信息 的 十 进 制 等 效 值 。 这 个 IP 地 址 的 32 位 二 进 制 表 示 为 
(10000000 00111101 00010111 11011000), 
( 128 61 23 216 Jo 
32 位 结构 的 IP 地 址 主要 用 于 因特网 路 由 。 了 D 地 址 的 最 高 几 位 构成 了 IP 网 络 的 代码 。 例 
如 ， 地 址 的 前 24 位 可 能 用 于 指定 一 个 IP 网 络 ， 而 后 8 位 唯一 地 标识 了 该 网 络 中 的 特定 设备 。 
习惯 上 ， 使 用 x.y.z.0/n 来 表示 一 个 IP 网 络 ， 其 中 是 IP 地址 中 用 于 标识 网 络 的 位 数 。 在 此 例 
H, IP 网 络 是 128.61.23.0/24，IP 地 址 的 前 24 位 构成 了 网 络 标 识 。 图 13-20 展示 了 一 个 通过 
路 由 器 连接 到 因特网 的 局 域 网 CLAN) 中 的 一 些 主机 。 在 该 图 中 有 多 少 个 IP 网 络 ? 


4 个 数字 


区 域 代 码 | 交换 号 | ras 









昌 、 有 兴趣 的 读者 可 以 参考 《 BGP4: Interdomain Routing in the Internet 》, by J.Stewart, Addison-Wesley [Stewart, 
1998]. 

日 ”我 们 的 讨论 仅 限于 IPv4。IPv6 使 用 64 位 寻 址 ， 用 于 解决 IPv4 的 32 位 寻 址 的 局 限 性 。 但 由 于 IPv4 已 经 被 
广泛 应 用 ，IPv6 需要 一 段 时 间 才 能 取代 IPv4 的 位 置 。 
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128.61.23.201 l= 128.61.22.4 
















128.61.23.216 128.61.23.245 





128.61.23.200 128.61.23.25 


图 13-20 IP 网 络 


KEEA. R AY EL TS Jy SPE REY ae AB TARIKI IP 网 络 ， 
地 址 为 128.61.23.0/244. KF, RAERAIA RM A ATE HEED 128.61.22.4, 
属于 不 同 的 IP 网 络 ， 地址 为 128.61.22.0/24。 


在 图 13-21 中 有 多 少 个 IP 网 络 ? 假设 32 位 JP 地 址 中 的 前 24 位 表示 IP 网 络 。 
x. 


图 中 共有 3 个 IP 网 络 : 第 一 个 IP 网 络 和 连接 了 图 中 底部 局 域 网 中 的 4 人 台 主 机 和 和 下方 路 由 器 (MBM 
h: 128.61.23.0/24 )， 第 二 个 P 网 络 将 两 个 路 由 器 连接 到 一 起 (网络 地 址 : 128.61.21.0/24 )， 第 三 个 IP 
网 络 连接 了 顶部 局 域 网 中 的 3 台 主 机 和 上 方 路 由 器 (网 络 地 址 : 128.61.22.0/24 )。 





再 


Cm > 128.61.22.7 


128.61.22.4 





128.61.22.5 










128.61. 


128.61,21.1 





128.61.23.216 128.61.23.245 


128.61.23.200 128.61.23.25 


图 13-21 多 个 IP 网 段 
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因特网 由 上 百 万 个 IP 网 段 组 成 ， 要 知道 IP 地 址 中 标识 网 络 的 位 数 不 需 要 总 是 24 位 。 假 
设 你 要 创办 一 家 公司 ， 需 要 将 1000 台 计 算 机 连接 到 因特网 。 你 需要 向 互联 网 服务 提供 商 
662] (ISP) 申请 一 个 前 22 位 固定 的 IP 地 址 区 间 ，IP 地 址 的 后 10 位 能 够 允许 1024 (20) 台 计 算 机 
接 和 人 因特网。 这 样 一 个 网 络 的 网 络 地 址 有 22 位 ， 点 分 十 进 制 的 形式 为 x.y.z.0/22。 组 织 中 所 有 
主机 的 IP 地 址 都 有 相同 的 前 22 位 ， 只 有 后 10 位 有 所 区 别 。 类 似 于 前 面 的 例子 ， 网 络 管理 员 

可 能 会 进一步 地 划分 IP 地 址 的 后 10 位 以 创建 子 网 。 


13.7.3 网 络 服务 模式 


现在 应 该 能 够 明确 地 知道 ， 在 大 型 网 络 中 的 数据 包 要 经 过 多 次 中 间 跳 才能 从 源 到 达 最 终 
目的 地 。 例 如 ， 在 图 13-21 中 ,考虑 从 左下 角 的 主机 (接口 地 址 : 128.61.23.200 ) 向 顶部 的 
主机 (接口 地 址 : 128.61.22.22 ) 发 送 数据 包 。 数 据 包 在 到 达 目 的 地 之 前 需要 进行 3 次 网 络 跳 
( 128.61.23.0/24, 128.61.21.0/24 和 128.61.22.0/24 ) 。 

电路 交换 ( circuit switching) 网 络 如 何在 终端 主机 之 间 快 速 地 传输 数据 包 ? 这 个 问题 由 
网 络 服务 模式 回答 。 在 我 们 开始 讨论 网 络 服 务 模式 之 前 ， 我 们 应 该 先 了 解 一 些 网 络 中 的 基础 
术语 。 让 我 们 从 电话 网 络 开 始 。 在 Alexander Graham Bell (电话 的 发 明 归 功 于 他 ) 之 后 ， 我 们 
已 经 走 过 了 很 长 的 路 。 通 话 不 再 是 使 用 两 个 终端 之 间 单 一 的 物理 线路 ， 而 是 在 呼叫 过 程 中 在 
两 端 之 间 进 行 一 大 堆 电 路 切换 。 虽 然 技术 已 经 发 生 了 巨大 的 变化 ， 但 从 早期 的 电话 开始 ， 其 
原理 一 直 是 相同 的 : 逻辑 上 ， 当 电话 呼叫 时 在 两 端 之 间 建 立 了 一 条 专用 线路 ， 这 称 作 电路 交 
换 (circuit switching)， 这 是 至 今 为 止 电话 中 所 使 用 的 主要 技术 。 设 想 Vasanthi 要 从 美国 佐治 
亚 州 亚特兰大 市 到 印度 泰 米尔 纳 德 邦 Mailpatti 去 探望 她 的 奶奶 。 作 为 一 个 偏执 的 人 ， 她 预订 
了 整个 的 旅程 ， 从 亚特兰大 机 场 的 接送 大 巴 到 最 后 到 达 奶 奶 家 的 牛 车 。 如 果 她 没有 在 这 个 旅 
程 中 的 某 处 出 现 ， 则 那 段 已 经 被 预订 的 位 置 就 会 被 闲置 。 电 路 交换 也 正 是 这 种 情况 。 

电话 呼叫 的 两 端 之 间 有 许多 交换 机 ， 在 交换 机 之 间 有 物理 链 路 连接 。 图 13-22 展示 了 两 
个 不 同 的 电路 (虚线) 并 存 同一 组 物理 链 路 ( 实 线 ) 和 交换 机 上 。 一 旦 呼叫 建立 ， 在 通话 过 程 
中 这 些 网 络 资源 (物理 链 路 的 带宽 ) 将 被 保留 。 因 此 ， 电 路 交换 能 够 保障 服务 质量 ,但 也 存在 
浪费 网 络 资源 的 风险 (例如 ， 当 电话 里 没 人 说 话 的 沉默 时 间 )。 交 换 机 之 间 的 承载 电话 会 话 的 
物理 链 路 可 以 同时 支持 多 种 信道 (channel) 或 电路 (circuit)。 如 频 分 复 用 (Frequency Division 
Multiplexing, FDM) 和 时 分 复 用 (Time Division Multiplexing, TDM) 等 技术 允许 多 个 并 发 连 
接 共享 物理 链 路 。 这 些 技术 能 够 划分 给 定 链 路 上 的 总 可 用 带宽 ， 建 立 专用 信道 来 文 持 个 人 会 
话 。 如 果 会 话 数量 达到 了 最 大 限制 ,那么 在 现 有 的 会 话 完 成 之 前 ， 不 会 受理 新 的 会 话 。 这 就 
是 为 什么 你 有 时 会 听 到 录音 ,“ 非 常 抱 菊 ， 目 前 线路 忙 ， 请 稍 后 再 拨 。” 这些 技术 细节 超出 了 

本 书 的 讨论 范围 ， 但 可 以 肯定 地 说 ， 这 些 技术 类 似 于 高 速 公 路 中 的 多 条 车 道 。 





图 13-22 电路 交换 。 两 个 不 同 的 电路 (虚线) 并 存 于 同一 组 物理 链 路 ( 实 线 ) 和 交换 机 上 
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分 组 交换 (packet switching) 电路 交换 的 一 种 替代 方法 是 分 组 (数据 包 ) 交换 。 设 想 
Vasanthi 第 二 次 去 她 奶奶 的 村 庄 ， 这 次 她 没有 预订 任何 行程 ， 而 是 在 每 个 中 转 站 让 票务 代理 
公司 根据 当前 情况 为 她 决定 最 好 的 行程 。 当 她 的 下 一 段 旅途 没有 空位 时 ， 她 也 可 能 不 得 不 等 
竺 一 会 儿 。 分 组 交换 的 基本 思想 也 与 这 种 情况 一 样 ， 不 会 在 物理 链 路 上 预 留 带宽 ， 当 一 个 分 
组 到 达 交 换 机 时 ， 交 换 机 检查 此 分 组 的 目的 地 ， 并 将 它 发 送 到 合适 的 链 路 上 。 图 13-23 展示 
了 分 组 交换 的 概念 图 (在 13.7 节 开 始 时 介绍 的 路 由 融 也 是 分 组 交换 的 一 个 例子 )。 它 具有 输入 
缓冲 区 和 输出 缓冲 区 ， 很 快 我 们 就 将 看 到 这 些 缓冲 区 的 目的 。 


输入 缓冲 区 [ 输出 缓冲 区 


图 13-23 ”分 组 交换 的 概念 图 。 交 换 机 的 输入 链 路 和 输出 链 路 都 有 相应 的 缓冲 区 ， 以 应 对 
突 发 的 网 络 流量 和 物理 链 踏 苑 争 


分 组 交换 网 络 也 称 为 存储 转发 ( store and forward) 网 络 。 在 整个 分 组 到 达 交 换 机 之 前 ， 
交换 机 无 法 向 外 发 送 这 个 分 组 ， 在 分 组 交换 网 络 中 ， 这 称 为 存储 转发 延迟 (store and forward 
delay)。 一 个 交换 机 可 以 有 多 条 物理 链 路 ， 每 条 输入 或 输出 物理 链 路 都 有 其 相应 的 缓冲 区 。 输 
人 缓冲 区 用 于 接收 分 组 到 达 的 位 ， 一旦 整个 分 组 都 已 经 到 达 ， 交 换 机 就 准备 好 把 分 组 发 送 到 
输出 链 路 。 分 组 交换 机 检查 目的 地 址 ， 并 根据 路 由 表 中 的 路 由 信息 ， 将 分 组 发 送 到 合适 的 输 
出 链 路 上 。 但 是 输出 链 路 可 能 仍然 忙于 传输 前 一 个 分 组 ， 在 这 种 情况 下 ， 交 换 机 就 会 将 分 组 
放 入 那 条 链 路 所 对 应 的 输出 缓冲 区 中 。 因 此 ， 在 实际 将 分 组 发 送 到 输出 链 路 之 前 可 能 会 有 一 
些 延 迟 。 这 在 分 组 交换 网 络 中 称 作 排队 延迟 ( queuing delay)。 你 能 够 想象 ， 这 种 延迟 取决 于 
网 络 拥 塞 的 状况 ， 是 可 以 变化 的 。 由 于 输入 /输出 可 用 的 缓冲 区 的 大 小 是 固定 的 ， 所 以 当 新 
的 分 组 到 达 时 ,缓冲 区 (无 论 是 输入 还 是 输出 ) 可 能 已 经 用 完了 。 在 这 种 情况 下 ， 交 换 机 可 能 
不 得 不 丢弃 一 个 分 组 (队列 中 的 一 个 分 组 或 者 刚 到 达 的 分 组 ， 具 体 取决 于 网 络 的 服务 模式 )。 
这 就 是 我 们 在 之 前 (参见 13.3 节 ) 所 提 到 的 数据 包 丢 失 (packet loss) 的 原因 。 图 13-24 展示 
了 分 组 交换 网 络 中 一 条 消息 的 分 组 流动 。 该 图 应 该 能 让 读者 联想 起 第 5 草 中 所 讨论 的 流水 线 
指令 执行 。 当 消息 的 分 组 充满 这 条 流水 线 时 ， 每 个 交换 机 都 在 同时 传输 着 不 同 的 分 组 。 

报 文 交换 ( message switching) 分 组 交换 网 络 假设 协议 栈 的 高 层 ( 例 如 ， 传 输 层 ， 参 
见 13.6 节 ) 负责 将 消息 划分 成 分 组 并 收集 分 组 构成 原始 消息 ， 以 及 处 理 分 组 的 乱 序 到 达 问 
题 。 但 把 这 个 功能 并 入 网 络 自身 也 是 可 能 的 ， 这 样 的 网 络 称 作 报 文 交换 网 络 。 如 图 13-25 所 
示 ， 在 这 种 情况 下 ， 交 换 机 对 一 条 完整 报 文 进行 存储 和 转发 ， 而 不 是 单个 分 组 。 应 该 看 到 ， 
分 组 交换 网 络 对 于 单条 报 文 能 够 有 更 短 的 延迟 (通过 流水 线 化 的 分 组 传输 ; 比较 图 13-24 和 
图 13-25 ) 。 而 且 ， 如 果 在 传输 过 程 中 出 现 位 错误 (这 可 能 由 于 携带 数据 的 物理 链 路 中 的 各 
种 电气 和 机 电 原 因 )， 其 影响 仅 局 限于 单个 分 组 ， 而 不 会 影响 整 条 报 文 。 读 者 可 能 已 经 推测 
到 ， 与 报 文 交换 相 比 ， 分 组 交换 会 累积 更 高 的 头 部 开销 ， 因 为 每 个 分 组 都 需要 被 单独 寻 址 、 
路 由 和 完整 性 检查 。 应 当 指 出 ， 报 文 交换 网 络 也 可 以 进行 流水 线 传输 。 不 过 是 对 报 文 进行 
流水 线 化 ， 而 不 是 一 条 消息 中 的 分 组 。 





时 间 

图 13-24 ”一 个 分 组 交换 网 络 。 在 第 一 个 时 间 点 ， 发 送 端 共有 4 个 分 组 需要 发 送 。 在 第 4 
个 时 间 点 ， 每 个 中 继 交 换 机 都 在 处 理 不 同 的 分 组 。 在 第 5 个 时 间 点 ， 消 息 的 第 
一 个 分 组 到 达 了 目的 地 。 假 设 没有 数据 包 丢失 ,之 后 消息 的 后 续 分 组 将 在 连续 
的 时 间 点 到 达 





时 间 
图 13-25 ” 报 文 交 换 网 络 。 每 个 交换 机 都 需要 等 到 报 文 完 整 到 达 后 才能 将 报 文 发 送 给 下 一 跳 


分 组 交换 网 络 的 服务 模式 ”分 组 交换 提供 了 以 下 几 个 优点 来 避免 范 争 ， 尤 其 是 对 于 计算 
机 网 络 : 

© 分 组 交换 网 络 能 够 充分 利用 物理 链 路 的 可 用 带宽 ， 而 不 像 电 路 交换 那样 提前 预 留 市 宽 
(使 用 FDM 或 者 TDM)。 这 就 是 为 什么 电话 网 络 中 昂 贯 的 国际 电话 也 开始 采用 分 组 交 
换 了 。 

。 因 为 预 留 机 制 ， 电 路 交换 能 够 保障 两 端 之 间 的 传输 时 间 ， 这 对 于 语音 流量 是 特别 重要 
的 。 但 是 ， 这 对 于 当前 在 因特网 中 占据 主导 地 位 的 数据 流量 不 是 那么 重要 。 随 着 网 络 
技术 的 进步 ， 其 至 需要 服务 质量 保障 的 应 用 程序 (例如 ,通过 因特网 提供 电话 服务 的 
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VoIP) 也 能 在 分 组 交换 网 络 中 很 好 地 工作 。 

© 分 组 交换 网 络 比 电路 交换 网 络 更 容易 设计 和 运行 。 

© 正如 我 们 之 前 观察 到 的 ， 报 文 交 换 中 的 报 文 比分 组 交换 中 的 分 组 粒度 大 ， 可 能 无 法 像 
分 组 交换 那样 有 效 地 使 用 网 络 。 此 外 ， 在 分 组 级 来 处 理 传输 中 的 位 错误 可 以 使 网 络 的 
整体 效率 更 高 。 

由 于 之 前 提 到 的 所 有 这 些 原因 ， 因 特 网 在 网 络 层 使 用 分 组 交换 ，IP 是 因特网 中 无 处 不 在 
的 网 络 层 协议 。 

在 分 组 交换 网 络 中 2?， 有 两 种 网 络 服务 模式 : 数据 报 (datagram) 和 虚 电 路 ( virtual 
circuit)。 数 据 报 服务 模式 类 似 于 邮政 服务 ， 每 个 数据 包 (分 组 ) 都 会 包含 目标 地 址 ， 途 中 的 
路 由 硕 通 过 查看 地 址 来 决定 合理 的 路 由 。 路 由 器 使 用 我 们 之 前 讨论 的 路 由 算法 来 构建 路 由 表 
并 不 断 更 新 ， 并 依据 路 由 表 来 决策 。 总 体 来 说 ， 因 特 网 支持 数据 报 服务 模式 。 

虚 电路 类 似 于 电话 呼叫 。 我 们 已 经 了 解 了 电路 交换 ， 其 中 为 每 个 独立 的 会 话 分 配 专 用 的 
物理 资源 ( 链 路 市 宽 )。 虚 电路 也 是 相似 的 ， 但 不 会 预 留 物理 资源 。 其 想法 是 在 呼叫 建立 (call 
setup) 阶段 建立 一 条 从 源 到 目的 地 的 路 由 ( 称 为 虚 电 路 )。 源 得 到 一 个 用 于 在 会 话 过 程 中 发 
送 数据 包 的 虚 电 路 号 。 途 中 的 路 由 融会 维护 一 张 表 ( 称 为 VC 表 )， 其 中 包含 了 路 由 器 当前 处 
理 的 与 虚 电 路 有 关 的 信息 ， 即 输入 链 路 (incoming link) 和 输出 链 路 (outgoing link)。 因 此 ， 
交换 机 决定 路 由 的 算法 非常 简单 ， 检 查 输 入 数据 包 中 的 VC 号 ， 查 询 VC 表 ， 并 将 数据 包 放 
和 相应 输出 链 路 的 输出 缓冲 区 中 。 最 后 当 消 息 传 输 完 成 后 ， 源 的 网 络 层 执行 呼叫 拆除 (call 
teardown)， 删 除 途 中 所 有 交换 机 中 的 相应 表 项 。 我 们 故意 简化 了 对 虚 电 路 的 讨论 ， 以 使 读者 
` 会 混淆 。 实 际 上 ， 在 连接 建立 阶段 ， 每 个 交换 机 都 能 够 对 新 的 连接 选择 一 个 局 部 VC 号 (为 
了 简化 网 络 管理 )， 所 以 VC 表 变 得 有 一 点 儿 复 琳 : 输入 数据 包 的 VC 号 (由 前 一 个 交换 机 选 
FE) 对 应 输入 链 路 ， 输 出 数据 包 的 VC 号 (由 此 交换 机 选择 ) 对 应 输出 链 路 。 网 络 层 协议 中 支 
持 虚 电 路 的 例子 包括 ATM 和 X.25。 因 特 网 卫 协议 只 支持 数据 报 服 务 模式 。 


13.7.4 网 络 路 由 与 转发 


我 们 要 明确 区 分 路 由 和 转发 ， 做 一 个 简单 的 比喻 将 会 有 所 帮助 。 考 虚 每 天 开车 去 工作 ， 
路 由 类 似 于 决定 从 家 到 工作 的 路 线 ， 而 转发 类 似 于 按照 选择 的 路 线 开 车 。 我 们 只 会 偶尔 进行 
一 次 路 线 选择 ， 但 每 天 都 会 开车 。® | 

除了 网 络 层 提 供 的 服务 模式 处 ， 路 由 和 转发 也 都 是 网 络 层 的 功能 。 我 们 不 希望 读者 产生 
网 络 层 每 次 从 传输 层 收 到 一 个 数据 包 都 需要 计算 一 次 路 由 的 印象 。 正 如 我 们 在 13.7 节 开 始 时 
所 提 到 的 ， 当 传输 层 发 送 来 一 个 数据 包 时 ， 网 络 层 决 定 这 个 数据 包 所 要 经 过 的 下 一 跳 ， 这 是 
网 络 层 的 转发 功能 。 网 络 层 维 护 一 张 转 发 表 (forwarding table) 来 实现 这 个 功能 ， 给 定 目 的 IP 
地 址 ， 就 能 计算 下 一 跳 的 IP 地 址 。 转 发 表 位 于 因特网 协议 栈 中 的 网 络 层 。 

上 述 讨 论 引 出 了 新 的 问题 ,“ 路 由 表 在 哪里 以 及 如 何 计算 路 由 ?” 在 第 8 章 中 ， 我 们 讨论 
了 操作 系统 中 执行 某 些 特定 功能 的 后 台 守 护 进程 。 例 如 ， 分 页 守护 进程 执行 页 面 蔡 换算 法 以 
确保 虚拟 内 存 系统 在 遇 到 页 面 错误 后 有 可 用 的 空闲 页 面 帧 池 。 基 本 目的 是 确保 操作 系统 中 的 
这 些 夭 记 (bookkeeping) 操作 不 在 程序 执行 的 关键 路 径 中 。 

全 “在 网 络 服务 模式 的 讨论 中 、 我 们 将 不 区 分 报 文 交 换 和 分 组 交换 ， 因 为 报 文 交 换 也 可 以 认为 是 一 种 特殊 的 分 


组 交换 ， 其 中 的 分 组 就 是 整 条 报 文 。 
© RFH EE Constantine Dovrolis 提供 了 这 个 非常 有 启发 性 的 例子 。 
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计算 网 络 路 由 也 是 操作 系统 的 后 台 活 动 。 在 UNIX 操作 系统 中 ， 你 可 能 会 看 到 一 个 名 叫 
routed 的 守护 进程 (路 由 守护 进程 )。 这 个 守护 进程 在 后 台 定 期 执行 ， 使 用 类 似 于 本 节 中 所 讨 
论 的 路 由 算法 来 计算 路 由 ， 并 创建 路 由 表 。 也 就 是 说 ， 计 算 路 由 不 是 通过 网 络 传输 数据 的 关 
键 路 径 。 当 网 络 发 生变 化 时 ， 路 由 表 被 广播 给 网 络 中 的 其 他 节点 ， 以 便 更 新 相应 节点 的 路 由 
表 。 路 由 守护 进程 使 用 新 发 现 的 路 由 来 更 新 协议 栈 网 络 层 中 的 转发 表 。 

13.7.5 ”网 络 层 总 结 
表 13-5 总 结 了 所 有 到 目前 为 止 我 们 已 经 讨论 过 的 与 网 络 层 功能 相关 的 关键 术语 。 
表 13-5 ”术语 网 络 关 键 概要 


网 络 术 语 定义 / 使 用 

电路 交换 电话 中 使 用 的 网 络 层 技术 。 在 通话 期 间 保 留 网 络 资源 (两 端 之 间 所 有 链 路 的 链 路 带宽 ); 没有 排 
队 延 迟 或 存储 转发 延迟 

TDM 时 分 复 用 ， 电 话 中 用 于 支持 在 一 条 物理 链 路 中 划分 多 个 信道 的 技术 

FDM 频 分 复 用 ， 也 是 电话 中 用 于 支持 在 一 条 物理 链 路 中 划分 多 个 信道 的 技术 

分 组 交换 在 因特网 中 广泛 使 用 的 一 种 网 络 层 技术 。 它 支持 尽力 而 为 的 分 组 传输 ， 且 不 会 在 途中 预 留任 何 
网 络 资源 

报 文 交换 与 分 组 交换 类 似 ， 但 是 粒度 为 整 条 报 文 (在 传输 层 ) 而 不 是 分 组 

交换 机 / 路 由 器 一 种 支撑 网 络 层 功 能 的 设备 。 可 能 就 是 一 台 有 数 个 网 络 接口 和 足够 内 存 的 计算 机 

输入 缓冲 区 交换 机 中 各 个 输入 链 路 的 缓冲 区 ， 用 于 收集 输入 的 数据 包 

输出 缓冲 区 交换 机 中 各 个 输出 链 路 的 缓冲 区 ， 以 应 对 链 路 繁忙 的 情况 

路 由 表 交换 机 中 根据 输入 数据 包 的 目的 地 址 给 出 下 一 个 跳 的 表 。 网 络 层 使 用 路 由 算法 来 计算 表 的 初始 
值 并 周期 性 地 更 新 

延迟 分 组 交换 网 络 中 的 分 组 所 经 历 的 各 种 延迟 

存储 转发 数据 包 在 完全 到 达 交 换 机 之 前 ， 在 输入 缓冲 区 中 的 等 待 时 间 

排队 数据 包 在 发 送 到 输出 链 路 之 前 ， 在 队列 中 的 等 待 时 间 

数据 包 丢 失 交换 机 因为 输入 或 输出 缓冲 区 已 满 而 不 得 不 丢弃 数据 包 。 同 时 也 表明 了 特定 路 由 的 网 络 拥塞 

服务 模式 网 络 层 与 协议 栈 上 层 的 约定 。 分 组 交换 网 络 所 使 用 的 数据 报 和 虚 电 路 模式 都 提供 了 尽力 而 为 的 
数据 传输 


虚 电 路 (VC) 这 种 模式 在 源 与 目的 地 之 间 建 立 一 条 虚 电 路 ， 数 据 包 只 需要 使 用 虚 电 路 号 而 不 用 包含 目的 地 
址 。 这 能 够 简化 交换 机 对 输入 数据 包 的 路 由 决策 

数据 报 这 种 模式 不 需要 建立 或 拆除 连接 。 每 个 数据 包 都 是 独立 的 ， 交 换 机 依据 路 由 表 中 的 信息 提供 尽 
力 而 为 的 服务 模式 


让 我 们 以 网 络 层 与 传输 层 的 关系 来 结束 网 络 层 的 讨论 。 值 得 注意 的 是 ， 网 络 层 完全 对 传 
输 层 隐藏 了 它 所 涉及 的 复杂 性 ， 这 就 是 抽象 的 力量 。 与 网 络 服务 模式 无 关 ， 传 输 层 本 身 可 以 
是 无 连接 的 (如 UDP)， 或 者 面向 连接 的 (如 TCP)。 然 而 在 一 般 情况 下 ， 如 果 网 络 层 支持 虚 
电路 ， 传 输 层 也 将 是 面向 连接 的 。 


13.8 ” 链 路 层 和 局 域 网 


到 目前 为 止 我 们 已 经 讨论 了 协议 栈 中 对 操作 系统 有 影响 的 两 层 协议 ， 让 我 们 将 注意 力 转 
移 到 对 硬件 有 影响 的 链 路 层 上 。 我 们 采用 了 自 上 而 下 的 方法 来 说 明 协 议 栈 ， 但 在 网 络 发 展 初 
W, 事实 上 ， 是 链 路 层 使 因特网 成 为 家 喻 户 晓 的 名 季 。 


本 质 上 ， 链 路 层 负责 获取 用 于 传输 的 物理 介质 ， 并 通过 物理 介质 向 目的 主机 发 送 数据 包 。 
但 是 ， 一 点 区 别 是 ， 链 路 层 处 理 帧 (frames)， 而 不 是 数据 包 。 依 据 链 路 层 的 技术 细节 ， 一 个 网 
络 层 的 数据 包 (例如 ，IP 协议 所 产生 的 ) 在 链 路 层 可 能 被 划分 为 多 个 帧 ， 以 便 传输 到 目的 地 。 

根据 控制 物理 介质 的 访问 机 制 ， 链 路 层 协 议 可 以 分 为 两 大 类 S， 随机 访问 (random access) 
和 和 轮流 访问 (taking turns), DARA] (Ethernet) 是 前 者 的 一 个 例子 ， 而 令 牌 环 (token ring) 是 
后 者 的 一 个 例子 。 如今， 以 太 网 是 链 路 层 中 最 普 凯 的 技术 ， 首 先 将 终端 设备 (主机 ) 连接 到 局 
域 网 ， 然 后 再 将 局 域 网 连接 到 广域网 。 

链 路 层 协议 中 访问 物理 介质 的 这 部 分 通 凋 称 为 介质 访问 控制 ( Media Access and Control, 
MAC) Jz. 


13.8.1 WAM 


历史 上 ， 以 太 网 是 将 计算 机 连接 到 一 起 的 电线， 如 图 13-26 所 示 。 我 们 使 用 术语 节点 
(node) 来 指 代 连 接 到 网 络 的 计算 机 或 者 主机 。 





以 太 网 电缆 
图 13-26 计算 机 通过 以 太 网 连 成 网 络 ， 这 类 似 于 连接 计算 机 系统 内 部 组 件 的 总 线 


让 我 们 来 了 解 一 下 以 太 网 协议 。 以 太 网 电缆 类 似 于 一 条 总 线 。® 然 而 与 我 们 在 前 面 章节 
中 看 到 的 不 同 ， 这 条 总 线 不 局 限于 一 台 计 算 机 ， 而 是 很 可 能 贯穿 整个 建筑 物 。 我 们 在 第 10 章 
中 提 到 了 总 线 仲 裁 (bus arbitration)， 一 个 决定 在 竞争 中 的 组 件 谁 能 够 使 用 总 线 的 方案 。 在 一 
条 连接 计算 机 内 部 组 件 (处 理 器 、 内 存 、1/O 设备 ) AAR, RZ (arbitration logic) 决 
定 在 需要 同时 访问 总 线 的 组 件 中 谁 能 够 控制 总 线 。 仲 裁 逻 辑 是 实现 总 线 仲裁 方案 的 实际 硬件 。 
由 于 计算 机 内 部 的 组 件数 量 是 有 限 且 固定 的 ， 所 以 设计 这 样 的 仲裁 逻辑 是 可 行 的 。 此 外 , 在 
一 台 计 算 机 内 部 ， 信 和 号 只 需要 传播 很 短 的 距离 (最 多 几 英尺 )。 另 一 方面 ， 以 太 网 要 将 一 个 几 
百 米 的 办 公 环 境 中 任意 数量 的 设备 连接 到 一 起 。 因 此 以 太 网 的 设计 者 不 得 不 考虑 一 些 其 他 的 
仲裁 方法 来 应 对 许多 设备 同时 使 用 介质 时 所 产生 的 竞争 ， 并 且 同 时 要 处 理 远 距离 传输 和 任意 
数量 设备 这 两 个 问题 。 


13.8.2 CSMA/CD 


一 种 随机 访问 通信 协议 称 为 载波 监听 多 路 访问 /冲突 检测 ( Carrier Sense Multiple Access/ 
Collision Detect，CSMA/CD)， 它 负责 以 太 网 等 广播 介质 的 基本 仲裁 。 我 们 将 继续 简单 而 浅显 
的 讨论 ， 不 会 太 多 地 深入 数据 传输 背后 通信 原理 的 细节 。 以 太 网 设计 者 采用 了 这 个 协议 来 应 

”我 们 借用 了 这 些 术 语 , 源 自 Kurose 和 Ross 的 书 ,《 Computer Networking: A Top Down Approach Featuring 

the Internet ), Addison-Wesley [Kurose, 2006]. 


© “我 们 将 在 13.9 节 中 看 到 ， 现 代 以 太 网 使 用 交换 机 且 是 端 到 端的 。 将 以 太 网 比 作 总 线 这 种 观点 对 于 理解 以 太 
网 协议 的 细微 差别 是 非常 有 用 的 


和 


对 远 距 离 传输 和 任意 数量 设备 这 两 个 问题 。CSMA/CD 的 基本 思想 来 自我 们 在 会 议 桌 上 礼貌 
地 与 同事 谈话 的 方式 。 我 们 会 先 确 保 周围 没有 人 正在 说 话 后 ， 开 始 说 话 。 如 果 两 个 以 上 的 人 
同时 想 说 点 什么 ， 我 们 会 先 财 嘴 ， 等 待 没 有 其 他 人 说 话 时 再 次 尝试 说 话 。 

CSMA/CD 协议 与 这 种 谈话 情形 没有 太 大 的 不 同 。 图 13-27 展示 了 计算 机 使 用 CSMA/CD 
发 送 一 帧 时 的 状态 转移 过 程 。 





图 13-27 CSMA/CD 的 状态 转移 过 程 


让 我 们 更 深入 地 了 解 CSMA/CD 的 协议 名 称 和 基本 思想 。 

1) 如 果 一 个 站 点 (station) (如 计算 机 ) 想 要 通过 介质 (如 电缆 ) 传输 数据 ， 它 会 先 监 听 是 
否 有 帧 正在 传输 。 如 果 有 ， 该 站 点 会 等 到 介质 空闲 后 再 开始 传输 。 如 果 介 质 空闲 ， 则 它 可 以 . 
立即 开始 传输 帧 。 介 质 上 没有 任何 电路 活动 就 意味 着 空闲 。 

2) 多 个 站 点 可 能 会 同时 监听 到 电缆 空闲 ， 它 们 都 认为 介质 是 空闲 的 ， 因 此 可 能 会 同时 开 
始 进行 由 传输， 协议 中 的 多 路 访问 这 个 术语 便 源 于 此 。 这 将 造成 问题 ， 我 们 很 快 就 会 看 到 协 
议 如 何 处 理 这 个 问题 。 

3) 每 个 站 点 在 开始 传输 帧 后 ， 会 监听 一 次 冲突 。 每 个 站 点 都 能 知道 介质 的 当前 电路 活动 
情况 。 如 果 它 观察 到 的 (通过 监听 ) 与 自己 的 行为 不 一 致 ， 它 就 会 知道 有 其 他 站 点 也 假定 介 
质 空闲 。 我 们 把 协议 中 的 这 部 分 称 为 冲突 检测 (collision detection)。 站 点 会 立刻 中 止 传输 并 
发 出 一 段 骂 声 脉冲 ( noise burst)。( 你 可 以 认为 这 是 有 时 能 在 收音 机 中 听 到 的 噪声 ,或 者 ， 继 
续 以 谈话 做 比喻 ， 当 多 个 人 同时 开始 说 话 时 ， 有 人 会 礼貌 地 中 断 并 说 “对 不 起 ”。) 噪声 脉冲 
警告 其 他 站 点 冲突 已 经 发 生 ， 之 后 站 点 会 等 待 一 个 随机 的 时 间 量 ， 然 后 再 次 重复 监听 、 传 输 、 
检测 冲突 这 个 循环 ， 直 到 它 成 功 地 完成 了 传输 。 该 算法 使 用 随机 数 来 决定 站 点 在 尝试 重新 传 
输 之 前 的 等 待 时 间 ， 随 机 范围 随 着 冲突 次 数 指数 增长 。 因 此 ， 算 法 的 这 部 分 通常 称 为 指数 退 
避 (exponential backoff) 。 

我 们 定义 冲突 域 (collision domain) 为 能 够 监听 到 彼此 传输 的 一 组 计算 机 。 有 

让 我 们 来 了 解 帆 究竟 是 如 何 传输 的 ， 以 及 如 何 检测 介质 是 和 否 空 闸 。 协 议 使 用 基带 信和 号 
(base band signaling)， 即 在 介质 (如 电缆 ) 上 直接 用 0 和 1 的 数字 信号 来 传输 帧 。 

日 以 把 以 太 网 比 作 总 线 的 观点 来 看 ， 连 接 到 以 太 网 的 每 台 主机 都 是 冲突 域 的 一 部 分 。 但 是 ， 我 们 之 后 将 在 


13.9 节 中 看 到 ， 现 代 的 网 络 设备 将 冲突 域 限 制 在 连接 到 相同 集线器 (或 者 一 组 相互 连接 的 集 线 希 ) 的 一 组 
主机 上 
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i (broadband) 是 指 在 相同 的 介质 上 同时 进行 多 个 消息 的 模拟 (analog) 传输 ， 不 同 的 
服务 使 用 不 同 的 频率 同时 发 送 它 们 的 消息 内 容 。 例 如 ， 你 家 里 的 电缆 服务 可 能 就 是 宽带 ,或 
许 在 这 一 条 线 中 同时 承载 7 电视 信和 号、 电话 服务 以 及 因特网 连接 。 


13.8.3 IEEE 802.3 


以 太 网 使 用 由 IEEE 制定 的 IEEE 802.3 标准 ， 采 用 CSMA/CD 协议 。 在 这 个 标准 中 ， 数 
字 帧 传输 使 用 曼彻斯特 码 ( Manchester code )， 即 一 种 特定 类 型 的 位 编码 技术 ( 见 图 13-28 ) 。 
这 种 编码 ， 从 低 跳 到 高 表示 0， 从 高 跳 到 低 表 示 lo Æ IEEE 802.3 标准 中 ， 低 电 平 是 -0.85V， 
高 电 平 是 +0.8$SV， 空 闲 时 是 0V。 每 位 的 传输 都 占用 一 个 固定 的 时 间 量 ， 曼 彻 斯 特 编码 技术 
确保 在 每 位 传输 的 中 间 都 有 一 个 电压 跳 变 ， 从 而 使 发 送 站 点 和 接收 站 点 能 够 同步 。 因 此 ， 当 
线路 中 有 帧 传输 时 ， 就 总 会 存在 电路 活动 。 如 果 在 一 位 的 传输 时 间 中 没有 电压 跳 变 ， 站 点 就 
会 假定 介质 空闲 。 由 于 以 太 网 采用 基带 信号 技术 ， 所 以 介质 上 每 次 只 能 有 1 帧 在 传输 。 





图 13-28 ”曼彻斯特 编码 。 从 低 跳 到 高 表示 0， 从 高 跳 到 低 表 示 1。 也 就 是 说 ， 当 线路 中 
有 数据 传输 时 总 存在 着 电压 波动 


应 当 提 到 的 是 ， 早 期 的 以 太 网 使 用 CSMA/CD， 而 现在 所 使 用 的 大 多 数 以 太 网 LAN 都 是 
没有 冲突 的 交换 式 以太 网 (参见 13.9 节 )。 同 时 也 注意 到 ， 有 趣 的 是 10 吉 比 特 ( 10-gigabit) 
以 太 网 其 至 不 支持 CSMA/CD， 因 为 它 假定 主机 通过 交换 链 路 连接 到 网 络 。 然 而 ， 以 太 网 作 
为 链 路 层 协 议 ， 为 了 兼容 性 会 继续 使 用 相同 的 传输 格式 《如 帧 头 )。 


下 面 经 过 曼彻斯特 编码 的 数据 流 所 代表 的 位 流 是 什么 ? 


只 


13.8.4 FARAS IEEE 802.11 


与 有 线 网 络 相 比 ， 无 线 网 络 又 带 来 了 新 的 挑战 。 为 了 区 分 ， 我们 应 该 提 到 一 个 用 于 无 线 
局 域 网 的 CSMA 协议 的 变种 ， 即 CSMA/CA, H CA 表示 冲突 避免 (Collision Avoidance), 
这 个 CSMA 变种 用 于 站 点 不 能 确定 介质 上 是 否 有 冲突 的 情形 。 有 两 个 原因 可 能 会 导致 冲突 检 
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测 出 现 问题 ， 第 一 个 原因 非常 人 简单， 就 是 执行 效率 。 冲 突 检测 假定 站 点 能 够 同时 进行 发 送 和 
接收 ， 这 样 才 能 验证 传输 是 否 被 其 他 站 点 干扰 。 对 于 有 线 介 质 ， 在 网 络 接口 中 实现 这 样 的 检 
测 能 力 在 经 济 上 是 可 行 的 ， 但 对 于 无 线 介 质 却 不 可 行 的 。 

第 二 个 厚 因 更 加 有 趣 ， 即 隐藏 终端 (hidden terminal) 问题 。 设 想 有 3 个 人 沿 着 一 条 长 走 
万 站 着 (图 13-29 中 的 Joe, Cindy 和 Bala), Cindy 能 听 到 Joe 和 Bala iti, 但 Joe 和 Bala 都 
只 能 听 到 Cindy 说 话 。Joe 和 Bala 可 能 会 同时 尝试 与 Cindy 交谈 ， 因 此 在 Cindy 处 会 有 冲突 ， 
但 是 Bala 和 Joe 都 不 会 认识 到 这 一 点 。 这 就 是 隐藏 终端 问题 ， 对 于 Bala 来 说 ，Joe 是 隐藏 的 ， 


反之 亦 然 。 
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图 13-29 ”隐藏 终端 问题 。Joe 和 Bala 相互 听 不 见 ， 但 当 他 们 同时 与 Cindy 说 话 时 ， 
Cindy 会 听 到 混乱 的 字句 


避免 冲突 的 一 种 方法 是 ， 发 送 端 通过 问 目 的 地 发 送 一 条 很 短 的 请 求 发 送 ( Request To 
Send, RTS) 帧 ， 明 确 地 向 目的 地 请 求 发 送 许可 。 目 的 地 (假设 这 个 RTS 帧 没有 受到 干扰 成 
功 到 达 目 的 地 ) 回复 一 个 允许 发 送 (Clear To Send, CTS) 帧 。 当 源 收 到 CTS 后 ， 就 向 目的 地 
发 送 数据 帧 。 当 然 ， 不 同 节 点 的 RTS 帧 之 间 可 能 会 发 生 冲 突 ， 但 幸运 的 是 ， 这 些 都 是 很 短 的 
数据 包 ， 因 此 不 会 造成 很 大 的 伤害 。 想 要 传输 的 节点 也 能 够 很 快 地 得 到 传输 许可 。 在 局 域 网 
中 的 所 有 节点 都 能 够 监听 到 RTS/CTS， 因 此 它们 在 数据 传输 完成 之 前 不 会 笠 试 发 送 RTS, M 
而 确保 不 会 发 生 冲 突 。 

RTS-CTS 握手 解决 了 隐藏 终端 问题 并 避 倪 了 冲突 。 

IEEE 802.11 RTS-CTS 标准 是 在 无 线 局 域 网 中 的 
使 用 RTS-CTS 的 CSMA/CA 协议 的 实现 规范 。 


13.8.5 SHRI 


正如 我 们 在 13.8 节 开 头 所 提 到 的 ， 以 太 网 等 随 
机 访问 协议 的 替代 方案 是 各 个 站 点 轮流 传输 帧 ， 一 
个 简单 的 想法 就 是 轮 询 (polling)。 主 节点 按照 预定 
的 顺序 轮 询 各 个 站 点 ， 看 它 是否 需 要 传输 。 当 从 主 
节点 获得 允许 后 ， 从 节点 就 开始 传输 消息 。 

令 牌 环 提 供 了 一 种 分 散 的 轮流 方式 ， 而 不 是 集 
中 管理 。 如 图 13-30 所 示 ， 其 基本 思想 是 将 网 络 中 
的 节点 连接 成 环 状 。 

令 牌 (token) 是 一 个 持续 在 线路 中 循环 的 特殊 ”图 13-30 令 牌 环 网 络 。 令 牌 会 在 主机 之 
位 模式 。 想 要 发 送 帧 的 节点 会 等 竺 并 获取 令 牌 ， 然 间 不 断 地 被 传递 ， 只 有 获取 令 
后 把 它 要 发 送 的 帧 放 和 人 线路 中 ， 最 后 将 令 牌 放 回 线 牌 的 主机 才能 进行 传输 





路 中 。 每 个 节点 都 会 检查 帧 的 帧 头 ， 如 果 发 现 它 就 是 该 帧 的 目的 地 ， 就 获取 该 帧 。 需 要 有 人 
移 除 帧 并 重新 生成 令 牌 通常 情况 下 ， 由 该 帧 的 发 送 者 负责 从 线路 中 移 除数 据 帧 并 重新 生成 
令 牌 。 大体 上 令 牌 环 也 与 广播 介质 类 似 ， 因 为 帧 会 经 过 环 上 的 所 有 节点 。 但 是 ， 如 果 令 牌 环 
网 络 跨越 了 辽阔 的 区 域 ， 则 由 目的 地 节点 负责 移 除数 据 帧 并 将 令 牌 放 回 线路 更 为 合理 。 

图 13-31 展示 了 在 令 牌 环 中 传输 帧 的 步骤 。 令 牌 环 在 设计 上 不 会 发 生 冲突 ， 但 也 有 自身 
的 缺陷 。 一 个 缺点 是 ， 节 点 必须 要 等 到 令 牌 才能 发 送 帧 ， 如 果 在 有 大 量 节点 的 局 域 网 中 ， 这 
可 能 会 导致 相当 大 的 帧 传输 延迟 。 另 一 个 缺点 是 ， 如 果 有 一 个 节点 没有 响应 ， 局 域 网 的 环 就 
晰 开 了 。 同 样 ， 如 果 环 上 的 令 牌 由 于 某 种 原因 丢失 或 损坏 ， 局 域 网 就 无 法 正常 工作 了 。 当 然 ， 
我 们 能 够 灵活 地 解决 所 有 这 些 问题 ， 但 是 帧 传输 的 延 玉 依旧 是 这 种 技术 的 严重 局 限 。 同 样 ， 
令 牌 环 也 有 它 的 优点 。 在 高 负载 下 以 太 网 就 会 达到 饱和 ， 但 由 于 高 负载 时 存在 过 多 的 冲突 ， 
利用 率 永 远 不 会 达到 100%。 而 令 牌 环 在 重负 载 状态 下 工作 良好 。 表 13-6 给 出 了 两 种 局 域 网 
协议 的 比较 。 





持 有 令 牌 的 主机 向 环 上 的 下 一 台 主 机 发 送 
一 条 消息 ， 每 台 主 机 依次 将 消息 传递 给 下 
一 台 主 机 。 如 果 某 台 主 机 是 消息 的 预期 接 
收 者 ， 它 就 复制 一 份 消 息 ， 但 依旧 将 消息 
发 送 给 下 一 台 主 机 。 消 息 会 一 直 传播 到 它 
返回 发 送 者 为 止 ， 发 送 者 会 验证 收 到 的 消 
息 是 否 与 发 出 的 消息 一 致 ， 并 将 其 删除 ， 
最 后 重新 开始 传递 令 牌 


图 13-31 令 牌 环 发 送 一 帧 的 步骤 


# 13-6 以 太 网 和 令 牌 环 的 比较 
链 路 层 协议 | # 点 | 优点 缺点 
以 太 网 随机 访问 ; 使 用 有 随机 性 的 | 管理 简单 ; 在 负载 轻 时 工作 | 在 高 负载 下 冲突 过 多 
CSMA/CD; 指数 退 避 恨 好 
令 牌 环 轮流 访问 ; 需要 传输 令 牌 公平 访问 ; 在 重负 载 下 工作 | 在 轻 负载 时 获取 令 牌 会 有 多 
良好 余 的 延迟 









13.8.6 ”其 他 链 路 层 协 议 


让 我 们 从 局 域 网 技术 的 角度 来 结束 本 节 。 以 太 网 和 令 牌 环 都 是 出 现 于 20 世纪 80 ERK 
与 90 年 代 初 的 链 路 层 技 术 。 然 而 ， 由 于 各 种 原因 ， 以 太 网 已 经 成 为 局 域 网 技术 中 的 局 家 。 虽 
然 我 们 已 经 学 习 了 随机 访问 协议 中 的 以 太 网 和 轮流 访问 协议 中 的 令 牌 环 ， 但 值得 一 提 的 是 ， 
还 有 一 些 其 他 的 链 路 层 协 议 。 它 们 中 的 一 些 有 着 优 于 以 太 网 的 性 能 ， 并 在 首次 推出 时 做 出 了 
惊人 的 承诺 。 光 纤 分 布 式 数据 接口 (Fiber Distributed Data Interface, FDDI) 和 和 出 步 传输 模式 
(Asynchronous Transfer Mode, ATM) 就 是 两 个 这 样 的 例子 。 FDDI 最 初 设 想 用 于 光纤 物理 介质 ， 
被 认为 特别 适合 在 大 学 校园 或 大 公司 等 大 型 组 织 中 作为 一 个 高 带宽 的 骨干 网 络 ， 将 一 些 基 于 
以 太 网 的 局 域 网 岛屿 连接 在 一 起 。 它 类 似 于 令 牌 环 ， 也 是 轮流 访问 协议 的 一 个 变种 。ATM 通 
过 预 留 链 路 带宽 和 进行 接 人 控制 ， 能 够 提供 服务 质量 保障 并 防止 网 络 拥塞 。 它 是 一 个 提供 了 
许多 网 络 层 功能 的 面向 连接 的 链 路 层 协议 ， 因 此 ATM 也 简化 了 直接 在 它 之 上 的 传输 层 协 议 的 
实现 。ATM 存在 于 一 些 由 电信 服务 提供 商 所 使 用 的 城 域 网 (MAN ) 或 广域网 (WAN) 中。 但 
是 与 以 太 网 相 比 ，ATM 过 于 复杂 ， 不 适合 在 局 域 网 中 使 用 。 

当今 另 一 个 被 广泛 采用 的 链 路 层 技术 是 点 对 点 协议 (Point to Point Protocol, PPP), PPP 
是 拨号 连接 所 使 用 的 链 路 层 协议 ， 它 的 广泛 应 用 源 自 大 量 用 户 群 体 所 使 用 的 拨号 连接 。 

有 趣 的 是 ， 以 往 每 次 有 威胁 存在 时 ， 以 太 网 都 能 找到 了 一 种 方法 改头换面 并 占据 上 风 。 
事实 上， 以 太 网 已 经 不 仅 是 局 域 网 所 选择 的 网 络 技术 ， 吉 比特 以 太 网 出 现 之 后 ， 就 在 大 型 组 
织 中 从 FDDI 处 抢占 了 连接 局 域 网 岛屿 的 风头 。10 吉 比 特 (10-gigabit) 以 太 网 已 经 出 现 并 成 
就 ， 且 开始 在 城 域 网 中 使 用 ， 这 使 得 ATM 已 经 快要 灭绝 。 


13.9 “网络 硬件 
这 里 我 们 不 会 去 深入 了 解 物理 层 的 详细 信息 ， 如 电路 、 无 线 电 以 及 光纤 的 光学 性 质 ， 有 


兴趣 的 读者 可 以 从 其 他 来 源 获取 这 些 信 息 (例如 ，[Kurose，2006; Tanenbaum，2002])。 我们 
将 了 解 当前 在 基于 以 太 网 的 局 域 网 中 普遍 使 用 的 网 络 设备 。 

1. 中 继 器 

电信 号 的 信号 强度 会 随 距离 衰减 ， 这 是 由 于 承载 信号 的 物理 线路 中 的 电阻 和 电容 有 热 损 
耗 所 导致 。 中 继 器 (repeater) 是 能 够 将 输入 连接 中 的 位 信号 放大 ， 再 传输 给 输出 连接 的 电路 
设备 。 由 于 局 域 网 能 够 跨越 相当 大 的 地 理 距 离 (例如 ,一 栋 大 厦 或 一 整个 校园 )， 因 此 需要 定 
期 增强 信号 强度 。 中 继 器 通常 用 于 局 域 网 和 广域网 ， 以 解决 信号 衰减 问题 。 

2. 集线器 

我 们 在 13.8.1 节 中 提 到 ， 以 太 网 在 逻辑 上 是 一 条 总 线 ( 见 图 13-26). RACH Chub) 本 质 
上 就 是 一 个 盒子 里 的 以 太 网 : 从 图 13-32 可 以 看 出 ， 图 13-26 中 的 以 太 网 电缆 被 集中 到 一 个 集 
线 器 里 。 人 集线器 将 从 一 台 主 机 收 到 的 位 传播 给 其 他 设备 (构成 一 条 逻辑 总 线 的 计算 机 和 其 他 
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集线器 ) 。 如 图 13-33 所 示 ， praa BIANA ERAON 
所 连接 的 逻辑 总 线 上 的 所 有 主机 都 在 同一 个 冲突 ww fo pee Eea 
域 中 。 冲 突 域 是 指 能 够 相互 监听 传输 的 一 组 计算 
机 (参见 13.8.1 节 )。 因 此 ， 连 接 到 集线器 的 计算 
机 需要 进行 冲突 检测 ， 并 按照 以 太 网 协议 进行 指 
数 退 避 ， 以 消除 冲突 并 完成 消息 传输 。 集 线 器 就 
是 多 端口 的 中 继 器 ， 因 此 这 两 个 术语 经 常 被 互 换 





集线器 
a 一 个 
使 用 。 图 13-32 四 端口 集线器 连接 4 台 计 算 


3. 网 桥 和 交换 机 机 的 简单 示例 。 在 电路 中 集线器 


只 不 过 是 一 条 总 线 
20 世纪 90 年 代 后 期 ， 局 域 网 的 发 展 过 程 
中 出 现 了 另 一 个 里 程 碑 ， 即 交换 式 以 太 网 (switched Ethernet)， 使 用 网 桥 (bridge) 和 交换 机 
(switch) 将 冲突 域 彼此 分 隔 。 例 如 ， 图 13-34 展示 了 使 用 网 桥 分 隔 两 个 冲突 域 。 主 机 1 和 主机 
wi 个 冲突 域 ， 主 机 3 和 主机 4 构成 了 男 一 个 冲突 域 。 主 机 1 向 主机 2 发 送 数 据 包 不 
经 过 网 桥 ， 而 如 果 目 的 地 是 主机 3 或 主机 4 则 需要 经 过 网 桥 。 这 种 流量 的 隔离 允许 主机 
a fi rt nosy 
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图 13-34 网 桥 将 主机 1 和 主机 2 的 冲突 域 与 主机 3 和 主机 4 的 冲突 域 分 隅 


当主 机 1 与 主机 4 同时 想 与 主机 3 与 主机 2 通信 时 会 发 生 什 么 ? 网 桥 会 发 现 冲突 并 让 两 
边 的 流量 依次 通过 (例如 ， 先 让 1 到 3 的 流量 通过 ， 再 在 下 一 个 网 络 周期 中 让 4 到 2 的 流量 
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通过 )。 为 此 ， 网 桥 需 要 拥有 足够 的 缓冲 能 力 用 于 在 冲突 出 现时 保存 数据 包 。 因 此 ， 不 在 同一 
个 冲突 域 的 主机 之 间 永 远 不 会 出 现 冲 突 。 网 桥 的 末端 称 为 端口 (port)， 它 根据 需要 将 数据 包 
发 送 到 其 他 端口 。 

虽然 网 桥 和 交换 机 经 第 在 文献 中 交 蔡 出 现 ， 但 有 些 作者 将 网 桥 定 义 为 连接 数量 有 限 的 
(通常 是 2 个 ) 冲突 域 的 设备 ， 如 图 13-34 所 示 。 交 换 机 在 功能 上 是 一 种 更 广泛 的 网 桥 ， 支 持 
任意 数量 的 冲突 域 。 图 13-35 展示 了 一 个 连接 4 个 冲突 域 的 交换 机 (4、B8B、C、D 各 代表 了 一 
个 独立 的 冲突 域 )。 


4- 冰 口交 换 机 





图 13-35 ”四 端口 交换 机 的 概念 图 。 冲 突 域 4 中 的 主机 能 够 在 冲突 域 8 与 冲突 域 D 有 通 
信 时 ， 同 时 与 冲突 域 C 中 的 主机 通信 


如 果 我 们 将 图 13-33 中 的 所 有 集线器 换 成 交换 机 ， 我 们 就 得 到 了 一 个 没有 神 突 的 交换 式 
以 太 网 。 

4. 虚拟 局 域 网 

虚拟 局 域 网 (Virtual LAN, VLAN) 是 交换 式 以 太 网 之 后 目 然 的 下 一 步 ， 利 用 如 图 13-36 
中 的 交换 机 实现 。 假 设 图 13-36 中 的 节点 1 和 节点 5 要 求 处 于 相同 的 VLAN 中 ; TRIPE, TA 
2、 节 点 6 和 节点 7 要 求 处 于 相同 的 VLAN 中 。 如 果 节 点 2 发 送 一 条 广播 消息 ， 则 节点 6 和 
节点 7 就 会 接收 到 此 消息 ， 而 其 他 节点 不 会 收 到 这 条 消息 。 因 此 ， 利 用 分 层 交 换 机 ， 不 同 地 
理 位 置 (因此 在 不 同 的 交换 机 上 ) 的 节点 仍然 能 够 构成 一 个 广播 域 。 

5. 网 卡 

网 卡 ( Network Interface Card，NIC)， 又 称 网 络 适 配 需 或 网 络 接口 卡 ， 使 计算 机 可 以 连接 
到 网 络 ， 也 能 使 主机 连接 到 集线器 、 网 桥 或 交换 机 。 当 连接 到 集线器 时 ， 网 卡 使 用 半 双 工 模 
式 进行 通信 ( 即 在 同一 时 间 内 ， 它 可 以 发 送 或 接收 数据 包 ， 但 两 者 不 能 同时 进行 )。 智 能 网 卡 
能 够 识别 它 是 和 否 与 网 桥 连接 ， 当 它 与 网 桥 连接 时 可 以 使 用 全 双 工 模式 或 者 半 双 工 模式 进行 通 
言 。 每 块 网 卡 都 有 一 个 介质 访问 控制 (MAC) 地 址 ， 网 桥 使 用 MAC 地 址 来 进行 数据 包 路 由 。 
网 桥 自 动 获 取 连 接 到 它 网 卡 的 MAC 地 址 。 
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图 13-36 虚拟 局 域 网 (VLAN): {1, 5}, {2, 6, 7} 和 13, 4, 8} 构成 了 3 个 VLAN 


网 桥 和 交换 机 都 只 了 解 MAC 地 址 ， 局 域 网 中 的 数据 流量 完全 以 MAC 地 址 为 基础 。 数 据 包 
的 结构 如 图 13-37 所 示 ， 有 效 载荷 ( payload ) 
是 指数 据 包 中 实际 消息 的 那 部 分 。 包 头 
(header) 包含 了 目的 节点 的 MAC 地 址 。 ~ y o 

F RA ( 即 因特网 ) 发 送 数据 
包 ， 节 点 需要 使 用 IP 协议 。 正 如 我 们 之 前 
在 13.7.2 节 所 看 到 的 ， 发 往 因 特 网 上 节点 
的 数据 包含 有 IP 地 址 ， 一 个 能 够 唯一 标识 目标 节点 的 32 位 二 进 制 数 。 

6. 路 由 器 

我 们 在 13.7.1 区 介绍 了 路 由 需 这 一 概念 ， 它 是 局 域 网 中 了 解 IP 地 址 的 主机 。 局 域 网 中 和 希 
望 回 因特网 发 送 消 县 的 主机 会 先 构建 一 个 数据 包 ， 如 岁 13-38 所 示 ， 并 使 用 路 由 器 的 MAC 地 
址 将 它 发 送 给 路 由 噩 。 发 送 给 路 由 器 的 有 效 载荷 中 包含 了 实际 消息 的 卫 头 ， 其 中 含有 目的 节 
点 的 IP 地 址 。 正 如 我 们 之 前 在 13.7.1 节 中 所 看 到 的 ， 路 由 器 使 用 路 由 表 来 帮助 它 路 由 实际 的 
消息 到 达 IP 地 址 所 标识 的 目的 节点 。 


路 由 器 的 MAC 地 址 目的 地 的 IP 地 址 


图 13-37 ”发 往 局 域 网 上 节点 的 数据 包 。 包 头 只 含 
有 目的 MAC 地 址 





目的 节点 的 载荷 
Bes H ate AY ER fay 


图 13-38 ”发 往 因 特 网 上 节点 的 数据 包 。 目 的 IP 地 址 是 发 送 给 路 由 器 节点 的 有 效 载 荷 的 一 部 分 


表 13-7 总 结 了 当前 在 搭建 计算 机 网 络 时 普遍 使 用 的 术语 和 设备 。 我 们 尝试 将 每 个 硬件 设 
备 对 应 到 OSI 模型 (等 价 于 因特网 协议 栈 ) 的 相应 层 。 


表 13-7 网 络 组 件 概 要 


组 件 名 称 定义 /功能 
主机 网 络 中 的 一 台 计 算 机 ; 在 计算 机 网 络 用 语 中 也 称 为 节点 或 站 点 
网 卡 将 计算 机 接 入 局 域 网 的 接口 设备 ; 对 应 于 OSI 模型 中 的 第 2 层 (数据 链 路 层 ) 


Sig H 中 继 器 / 集线器 / 交换 机 中 用 于 连接 计算 机 的 末端 ， 对 应 于 OSI 模型 中 的 第 1 层 (物理 层 ) 
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( 2 ) 
组 件 名 称 定义 /功能 

冲突 域 用 于 表示 在 消息 传输 期 间 相 互 干扰 的 一 组 计算 机 

中 继 需 增强 输入 端口 的 信号 强度 并 在 输出 端口 如 实地 重新 生成 位 流 的 设备 ; 用 于 局 域 网 和 广域网 ， 对 
应 于 OSI 模型 中 的 第 1 层 (物理 层 ) 

集线器 作为 多 端口 的 中 继 右 ， 将 多 台 计 算 机 连接 到 一 起 形成 单一 的 冲突 域 ; 对 应 于 OSI 模型 中 的 第 1 
层 (物理 层 ) 

网 桥 连接 并 分 隔 独 立 的 冲突 域 ; 通常 有 2 ~ 4 个 端口 ; 使 用 MAC 地 址 ; 对 应 于 OSI 模型 中 的 第 2 
层 (数据 链 路 层 ) 

交换 机 功能 类 似 于 网 桥 ， 但 支持 多 个 端口 (通常 4 ~ 32 ) ; 对 连接 到 交换 式 网 络 的 计算 机 提供 虚拟 局 
域 网 的 动态 配置 和 分 组 等 扩展 功能 ; 对 应 于 OSI 模型 中 的 第 2 层 (数据 链 路 层 ) 

et FH ae 本 质 上 是 一 个 交换 机 ， 但 能 从 局 域 网 癌 因特网 路 由 消息 ; 对 应 于 OST 模型 中 的 第 3 层 (网 络 层 ) 


虚拟 局 域 网 现代 交换 机 允许 将 物理 上 分 散 有 晶 连 接 到 不 同 交 换 机 的 计算 机 进行 分 组 ， 以 便 构 建 一 个 局 域 网 ; 
VLAN 独立 于 计算 机 的 物理 人 位置， 提供 更 高 级 的 网 络 服务 ， 例 如 在 因特网 子 网 中 进行 广播 和 多 
播 ; 对 应 于 OSI 模型 中 的 第 2 层 (数据 链 路 层 ) 


13.10 ”协议 栈 各 层 之 间 的 关系 


值得 注意 的 是 ， 传 输 层 、 网 络 层 和 和 链 路 层 会 在 不 同 的 层 上 处 理 数据 的 完整 性 。 例 如 ， 无 
处 不 在 的 传输 协议 TCP 和 因特网 上 的 网 络 协 议事 实 标 准 IP 都 在 它们 的 规范 中 包含 了 数据 包 
的 错误 检查 。 咱 一 看 这 似乎 是 多 余 的 。 但 是 ， 虽 然 由 于 因特网 的 普及 性 ， 我 们 在 现实 中 经 常 
会 一 口气 说 “TCP/IP”, 但 是 TCP 不 一 定 要 运行 在 正之 上 ， 它 也 可 以 使 用 ATM 等 其 他 的 网 
络 协议 ，TCP 也 不 是 唯一 能 运行 在 IP 之 上 的 传输 协议 。 而 且 ， 中 间 路 由 如 (只 人 负责 网 络 层 处 
理 ) 同样 也 不 需要 检查 数据 包 的 完整 性 。 因 此 ，IP 规范 需要 考虑 数据 包 的 完整 性 ， 不 能 假设 
传输 层 一 定 会 做 检查 。 

网 络 层 不 把 数据 完整 性 检查 交 给 链 路 层 也 是 同样 的 道理 。 不 同 的 链 路 层 提供 不 同 级 别 的 
数据 完整 性 。 因 为 网 络 层 可 能 会 运行 在 不 同 的 链 路 层 协议 之 上 ， 所 以 网 络 层 乱 要 目 己 进行 端 
到 端的 数据 完整 性 保障 。 让 我 们 回 到 13.2 节 的 例子 (ILE 13-3 )。Charlie 的 母亲 使 用 尤 巴 市 
家 里 的 计算 机 回复 了 Charlie 的 电子 邮件 ， 她 的 机 需 使 用 PPP 协议 回 服 务 提供 商 传输 IP 数据 
包 ， 服 务 提供 商 之 间 使 用 一 个 称 作 帧 中 继 (frame relay) 的 协议 进行 通信 ， 在 校园 骨干 网 中 使 
用 FDDI 协 议 ， 最 后 使 用 以 太 网 协议 到 达 Charlie 的 计算 机 。 


13.11 用 于 数据 包 传 输 的 数据 结构 ， 


我 们 在 前 面 的 章节 中 逐渐 经 过 了 协议 栈 的 各 层 ， 让 我 们 先 花 一 分 钟 跨 口 气 ， 上 再 慢 慢 回 到 
协议 栈 的 顶端 。 让 我 们 来 考察 实现 数据 包 传 输 所 需要 的 最 小 数据 结构 。 

传输 层 将 应 用 层 的 一 条 消息 或 消息 流 划 分 成 数据 包 后 再 传递 给 网 络 层 ， 网 络 层 再 将 每 个 
数据 包 分 别 路 由 到 目的 地 。 因 此 ， 每 个 数据 包 都 需要 包含 目标 地 址 。 此 外 ， 每 个 数据 包 还 要 
包含 一 个 序号 以 实现 传输 层 的 分 散 / 收集 功能 。 我 们 将 这 些 数 据 包 中 不 同 于 实际 数据 的 元 数 
据 (metadata), PRIE EL (packet header)。 除 了 目的 地 址 和 序号 外 ， 包 头 还 可 能 包含 源 地 址 
和 校 验 和 (用 于 让 目的 主机 验证 数据 包 的 完整 性 ) 等 信息 。 

传输 层 从 应 用 层 接收 消息 ， 将 其 划分 为 与 网 络 特性 相符 的 数据 包 ， 并 在 每 个 数据 包 前 面 
加 上 和 包头。 图 13-39 和 图 13-40 使 用 与 C 语音 类 似 的 语法 分 别 展示 了 一 个 简单 的 包头 和 一 个 


效 据 包 的 数据 结构 。 字 段 num_packets 使 目的 地 的 传输 层 知 道 它 是 否 接收 到 了 所 有 的 数据 包 ， 
以 便 组 成 一 条 完整 的 消息 ， 并 传递 给 应 用 层 。 目 的 地 为 了 组 成 完整 的 消息 ， 必 须要 发 送 端 传 
输 num packets 信息 ; 但 是 为 什么 每 个 数据 包 的 包头 都 含有 这 个 字段 ? 我 们 需要 提醒 自己 注 
意 网 络 是 变化 更 测 的 ， 每 个 数据 包 都 重复 携带 这 个 信息 的 原因 是 数据 包 可 能 会 乱 序 到 达 。 当 
传输 层 接收 到 第 一 个 新 消息 的 数据 包 时 需要 知道 要 为 这 条 消息 分 配 多 少 缓冲 区 空间 才能 够 完 
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struct header t { 
int destination_address; /* destination address */ 
int source address; /* source address */ 
int num packets; /* total number of packets in 
the message */ 
int sequence number; /* sequence number of this 


packet */ 

int packet size; /* size of data contained in 
the packet */ 

int checksum; /* for integrity check of this 
packet */ 





图 13-39 ”一 个 传输 层 数 据 包 的 包头 示例 


struct packet t { 
struct header t header; /* packet header */ 
char *data; /* pointer to the memory buffer 


containing the data of size 
packet size */ 





图 13-40 ”传输 层 数据 包 的 数据 结构 示例 


HERES 一 个 数据 包 的 包头 由 以 下 字段 组 成 : 
destination address (目的 地 址 ) 
source address ( 源 地 址 ) 
num packets (数据 包 数 ) 
sequence number ( 序号 ) 
packet size (数据 包 大 小 ) 
checksum ( 校 验 和 和) 
假设 这 些 字段 的 每 个 占 4 字 节 ， 数 据 包 的 大 小 为 1500 字 节 ， 计 算数 据 包 的 有 效 载荷 。 
E., 


数据 包 的 包头 大 小 = Eak + kh + RRA + SAD + RHA) + RAO 
= 6 X 4B = 24B 

数据 包 的 总 大 小 = 数据 包 的 包头 大 小 十 数据 包 的 有 效 载 荷 

数据 包 的 有 效 载荷 = 数据 包 的 总 大 小 一 数据 包 的 包头 大 小 =1500 -24= 1476B 


13.11.1 TCP/IP 包头 


需要 强调 的 是 ， 每 层 (传输 层 、 网 络 层 和 链 路 层 ) 包头 的 实际 结构 取决 于 该 层 的 协议 细 
+ Mil, 我们 之 前 提 到 过 ，TCP 是 面向 字 节 流 的 协议 ， 它 将 字 节 流 划分 成 段 (segment) 作 
为 传输 单元 (我 们 在 之 前 的 传输 层 讨论 中 一 直 把 它 称 作 数据 包 )。 序 号 占据 段 中 第 一 个 字 节 的 
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位 置 ， 它 表示 这 个 段 在 字 节 流 中 的 位 置 。 由 于 TCP 是 面向 连接 的 ， 所 以 包头 中 也 含有 端口 号 
字段 ， 连 接 的 两 端 分 别称 为 源 端口 ( source port) 和 目的 端口 ( destination port)。 由 于 TCP 连接 
中 的 数据 流 是 双向 的 ， 所 以 在 发 送 新 数据 时 包头 还 可 以 撒 带 已 接收 数据 的 确认 人 信息。 包头 中 的 
确认 序号 (acknowledgement number) 表示 预期 会 从 此 连接 中 接收 到 的 下 一 个 数据 包 的 序号 。 由 
于 TCP 协 以 有 内 置 的 拥塞 控制 ， 所 以 包头 还 包含 了 窗口 大 小 (window size) 字段 ， 这 个 字段 的 
作用 即 有 趣 又 重要 。 两 端 都 可 以 依据 延迟 时 间 和 丢 包 后 的 重 传 次 数 来 监视 网 络 拥塞 状况 。 发 送 
痊 根 据 这 些 指标 ， 利 用 在 包头 中 的 窗口 大 小 字段 来 宣布 它 愿 意 从 另 一 端 接 收 的 数据 量 。 同 样 ， 
发 送 问 也 是 根据 这 些 指 标 来 选择 段 的 长 度 。 除 此 以 外 ， 段 中 还 有 一 些 其 他 的 特殊 字段 : 

e SYN: 它 标 志 新 字 节 流 的 开始 ， 用 于 在 两 端 之 间 同 步 传输 的 起 始 序 号 。 

e FIN: 它 标志 字 市 流传 输 的 结束 。 

。ACK: 它 标 志 包 头 中 撒 带 有 ACK， 因 此 确认 序号 字段 是 有 意义 的 。 

。URG : 它 标志 这 个 数据 段 中 有 “紧急 ”数据 。 例 如 ， 如 果 你 按 下 Ctrl-C 终止 了 一 个 网 

络 程序 ， 那 么 应 用 层 协议 会 将 其 转换 为 一 个 紧急 消息 交 给 TCP. 

源 和 目的 IP 地 址 都 是 它们 自己 从 网 络 层 那里 隐 式 获取 的 。 包 头 中 包含 这 些 IP 地 址 的 部 
分 称 为 伪 包 头 (pseudo header)， 在 段 传输 及 接收 过 程 中 ， 它 会 在 因特网 协议 栈 中 的 TCP 和 IP 
之 间 来 回 传输 。 

IP 数据 包 的 格式 非常 简单 。IP 将 传输 层 的 消息 (或 TCP 的 段 ) 划分 成 多 个 IP 数据 包 ， 并 
在 目的 地 将 这 些 数 据 包 重 组 成 原始 的 消息 。 因 此 ， 除 了 源 和 目的 IP 地 址 外 ，]IP 包头 还 包含 该 
IP 包 的 长 度 和 段 偏 移 量 ( 即 这 个 数据 包 在 传输 层 消 息 中 的 位 置 )。 


13.12 ”消息 传输 时 间 


现在 我 们 已 经 知道 了 消息 如 何在 网 络 中 传输 ， 接 下 来 让 我 们 更 详细 地 了 解 消息 传输 所 需 
的 时 间 。 在 13.6 节 中 ,为 了 使 传输 协议 的 讨论 保持 简单 ,我们 忽略 了 除 介质 的 传播 时 间 外 的 
其 他 所 有 时 间 开 销 。 现 在 让 我 们 来 了 解 网 络 的 连通 性 会 如 何 影响 端 到 端的 传输 时 间 。 为 此 ， 
首先 考虑 在 两 端 之 间 传 输 消 息 可 能 会 涉及 的 时 间 元 素 。 图 13-41 展示 了 这 些 要素 。 





Tw 


图 13-41 ”消息 传输 时 间 可 以 分 为 4 个 部 分 : 发 送 端 延迟 (5S)、 传 输 延 返 ( 7T,)、 传 播 时 间 
(T;), PAR Pec HEIR (R) 


Ty 
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我 们 将 简单 地 了 解 消息 传输 时 间 ， 消 息 传输 的 总 时 间 由 以 下 几 部 分 组 成 : 

1 ) 发 送 端的 处 理 延 迟 (S): 这 是 在 发 送 端 协议 栈 各 层 中 累积 消耗 的 时 间 ， 其 中 包括 : 

。 传输 层 功能 消耗 的 时 间 ， 包 括 将 消息 划分 成 数据 包 、 向 数据 包 添 加 包头 、 计 算数 据 包 

的 校 验 和 。 l 

。 网 络 层 功能 消耗 的 时 间 ， 例 如 给 数据 包 查 找 路 由 。 

。 链 路 层 功 能 消耗 的 时 间 ， 如 介质 访问 控制 和 数据 成 帧 。 

© 物理 层 中 与 特定 介质 相关 的 功能 所 消耗 的 时 间 。 

这 部 分 时 间 取 决 于 协议 栈 的 软件 架构 细节 和 实际 实现 的 效率 。 

2) 传输 延迟 (Tu): 这 是 发 送 剖 将 位 传人 线路 所 需要 的 时 间 ， 也 就 是 ， 从 你 的 计算 机 传 入 
物理 介质 的 时 间 。 例 如 ， 对 于 一 条 给 定 的 消息 ， 吉 比特 链 路 的 传输 延迟 7, 会 远 小 于 拨号 连接 。 


对 于 一 条 21MB 大 小 的 消息 ，(a) 计算 使 用 56Kbits/s 拨号 连接 时 的 传输 延迟 ; (b) 计算 使 用 吉 


比特 网 络 连 接 时 的 传输 延迟 。 
2 


a. 传输 延迟 = 消息 大 小 /网 络 带 宽 = (21K2"x*8b) / (562 b/ #) =3 x2" Fb = 3072 H 
b. 传输 延 训 = 消息 大 小 /网 络 带 宽 = (21K2"*8 b) / (10° b/ #) =0.176 4 





3 ) 传播 时 间 (T): 这 是 从 发 送 问 将 消息 传人 线路 到 消息 到 达 接 收 疹 的 网 络 接口 所 需要 的 
时 间 。 也 就 是 说 ， 我 们 把 消息 在 传输 途中 所 经 历 的 延迟 都 混合 到 了 一 起 。 消 息 所 经 历 的 延迟 
有 以 下 两 种 : 
。 传 播 延 迟 : 这 是 位 信息 从 点 4 沿线 路 传播 到 点 B 所 需要 的 时 间 ， 这 个 时 间 取 决 于 许多 
因素 。 第 一 个 因素 涉及 两 点 之 间 的 距离 与 光速 。 例 如 ， 两 点 离 得 越 远 ,位 信息 在 线路 
中 传输 的 距离 就 越 长 ， 因 此 也 会 消耗 更 多 的 时 间 。 这 就 是 我 们 从 亚特兰大 市 访问 CNN 
的 网 站 会 比 从 印度 班加罗尔 快 的 原因 。 除 了 距离 外 ， 还 有 其 他 因素 会 影响 To T, 已 经 
计算 了 从 计算 机 连接 到 物理 网 络 的 时 间 。 但 在 实际 中 ， 除 了 计算 机 与 网 络 的 连接 外 ， 
传输 的 消息 在 到 达 目 的 地 之 前 可 能 还 需要 穿 过 多 条 (市 宽 不 同 的 ) 物理 链 路 。 因 此 我 们 
还 需要 对 途中 的 每 条 物理 链 路 分 别 计算 传播 延迟， 并 求 和 以 得 到 总 的 传播 延迟 。 为 了 
简单 起 见 ， 我 们 把 各 段 延 迟 的 和 称 作 端 到 端的 传播 延迟 。 
。 排队 延迟 : 我 们 之 前 已 经 提 到 过 ,广域网 其 实 是 一 个 网 络 的 网 络 ( 见 图 13-3 )。 消 息 在 
经 过 沿途 的 交换 机 时 会 遇 到 排队 延 人 返 。 此 外 ， 途 中 还 有 一 些 中 间 网 络 协议 负责 把 消息 
传递 给 目的 地 ， 这 些 协议 也 会 增加 延迟 时 间 。 最 终 ， 接 收 端 从 线路 中 接收 数据 包 并 存 
入 网 络 接口 中 的 一 个 缓冲 区 。 
为 了 简单 起 见 ， 我 们 把 上 面 的 这 些 延 迟 全 部 混合 在 一 起 ， 称 作 传 播 时 间 (time of flight) o 
4) 接收 端的 处 理 延 迟 (R): 这 部 分 时 间 对 应 于 发 送 端的 处 理 延 迟 ， 同 样 具有 物理 层 、 链 
路 层 、 网 络 层 以 及 传输 层 的 延迟 。 
消息 传输 的 总 时 间 = S+7,+7,+R - (13-1 ) 


st (13-1 ) 也 表示 了 消息 的 端 到 端 延迟 。 我 们 很 容易 从 这 个 式 ( 13-1 ) 中 看 到 ， 计 算 机 与 

网 络 之 间 的 接口 带宽 不 足以 说 明 网 络 通信 的 延迟 时 间 。 我 们 可 以 依据 消息 传输 时 间 来 计算 吞 
吐 量 (throughput)， 它 定义 为 网 络 的 实际 传输 速率 。 

吞吐 量 = 消 息 大 小 / 端 到 端 延 识 ( 13-2.) 


ee fe 


我 们 已 经 知道 ， 一 条 消息 需要 经 过 多 跳 才 能 从 源 到 达 目 的 地 。 因 此 ， 每 条 消息 在 任意 两 
个 网 络 跳 之 间 都 需要 经 历 以 下 延迟 : 发 送 端的 处 理 延 迟 、 传 输 延 迟 、 介 质 上 的 传播 延迟 、 排 
队 延 退 、 以 及 接收 痪 的 处 理 延 迟 。 我 们 为 了 简化 本 节 中 消息 传输 时 间 的 讨论 ， 只 让 读者 对 端 
到 端的 延迟 有 所 感受 ， 因 此 将 端 到 端的 所 有 延迟 (除了 发 送 端的 处 理 延 迟 、 传 输 延 迟 和 接收 
闪 的 处 理 延 到 外 ) 都 算 入 了 传播 时 间 。 


考虑 下 列 条 件 : 

发 送 端的 处 理 延 信 =1 ms 
消息 大 小 =1000 b 
线路 带宽 =1 000 000 b/s 
传播 时 间 =7 ms 
接收 端的 处 理 延 识 =1 ms 

请 计算 吞吐 量 。 

A 


消息 传输 的 总 时 间 =S+T,+Tz+R， 其 中 

S (RK n HY Ab BE EIR ) =1 ms 

T, (传输 延迟 ) = 消息 大 小 /线路 带宽 = 1000/1 000 000 s= 1 ms 

T; (传播 时 间 ) =7 ms 

R (接收 端的 处 理 延 迟 ) =1 ms 

因此 ， 传输 一 条 1000 位 消息 的 时 间 = 1+1+7+1 ms = 10 ms. 

吞吐 量 = 消息 大 小 /传输 时 间 =( 1000b) / (10 毫秒 ) = 100 000 b/b 


下 面 的 例子 说 明了 ， 当 消息 传输 过 程 中 存在 数据 包 丢 失 时 所 需要 传输 的 数据 包 数 量 。 
考虑 下 列 条 件 : 


消息 大 小 =1900 Kb 
包头 大 小 =1000b 
数据 包 大 小 =20 Kb 
假设 传输 中 有 10% 的 数据 包 会 出 错 (ACK 包 不 会 出 错 ， 也 没有 数据 包 丢 失 )， 且 每 个 数据 包 都 是 被 
单独 确认 的 ， 则 发 送 端 要 完成 消息 传输 总 共 需 要 发 送 多 少 个 数据 包 ? 


答 : 

数据 包 大 小 = 包头 大 小 + 有 效 载荷 

20 000=1000+ 有 效 载荷 

数据 包 中 的 有 效 载 柯 =19 000 b 

发 送 消息 所 需要 的 数据 包 数 量 =1 900 000/19 000=100 

由 于 10% 的 数据 包 传 输 失 败 ， 所 以 数据 包 的 总 数 =100+10+1=111 
发 送 的 数据 包 丢失 RH 

100 10 90 

10 1 9 

= 0 a | 

111 100 
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下 面 的 例子 说 明了 当 存在 滑 窗 协 议 时 的 消息 传输 开销 。 
考虑 下 列 条 件 : 


消息 大 小 =1900 Kb 

包头 大 小 =1000b 

数据 包 大 小 =20 Kb 

线路 带宽 =400 000 b/s 

传播 时 间 =2 s 

窗口 大 小 =10 

发 送 端的 处 理 延 次 =0 

He WNC stig BY Sb FE HEIR =0 

ACK 大 小 = 忽略 不 计 ( 视 为 0) 
假设 网 络 中 没有 错误 并 且 数 据 包 按 序 传输 ， 那 么 要 完成 消息 传输 总 共 需 要 多 少时 间 ? 
=: 

数据 包 大 小 = 包头 大 小 十 有 效 载荷 

因此 ， 数 据 包 中 的 有 效 载荷 = 数据 包 大 小 -包头 大 小 =20000-1000 = 19000 b 

发 送 消息 所 需要 的 数据 包 数 量 =1 900 000/19 000=100 

数据 包 的 传输 延迟 = 数据 包 大 小 /线路 带宽 =20000/400000s=0.05s 

BE EL FE R IX tg BY HEIR = SHT, = KK dig BY Kb FE FE GR + 7% Hy FEIR = 0+0.05 s = 0.05 s 
由 于 窗口 大 小 为 10， 所 以 发 送 端 将 10 个 数据 包 传 入 线路 ， 并 开始 等 待 ACK。 发 送 端的 时 序 图 如 

下 图 所 示 。 





10 个 数据 包 第 一 个 
A 
0.05 ee 0.05 
4 秒 
发 送 病 时 间 轴 


接收 端 在 第 一 个 数据 包 发 出 2 秒 后 收 到 这 个 数据 包 。 
数据 包 的 端 到 端 延 总 =S+T, ATR = 0+0.05+2+0 s = 2.05 s 
当 接 收 端 收 到 数据 包 时 ， 立 即 开始 准备 ACK 包 。 
接收 端 生成 ACK 包 的 开销 = (S+T,)( 在 接收 端 )=0+0 (AW ACK 包 的 大 小 可 以 忽略 不 计 )=0 
ACK 包 的 端 到 端 延 训 =S+7,47,+R = 0404240 s=25 
因此 ， 如 上 图 所 示 ， 在 第 一 个 数据 包 传 入 线路 的 4 秒 后 ， 发 送 端 收 到 第 一 个 ACK。 更 普遍 的 是 ， 
每 个 ACK 都 是 在 相应 数据 包 传 入 线路 的 4 秒 后 被 接收 (假设 没有 数据 包 丢 失 )。 
在 这 样 的 网 络 中 ，10 个 数据 包 所 对 应 的 10 ACK 会 以 0.05 秒 的 间隔 相继 到 达 ， 如 下 图 所 示 。 


10 个 数据 包 Abate 





发 送 端 时 间 轴 
当 发 送 端 收 到 第 一 个 ACK 后 ， 就 可 以 继续 发 送 下 一 个 数据 包 。( 滑 动 窗口 的 大 小 是 10 ) 接 下 来 的 
10 个 数据 包 会 一 个 接 一 个 地 发 送 ， 如 上 图 所 示 。 
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Alt, Æ 4.05 秒 的 周期 内 ， 发 送 端 发 出 了 10 个 数据 包 并 收 到 一 个 ACK。 之 后 每 4.05 秒 就 会 重复 
一 次 这 个 周期 ， 并 发 送 10 个 新 的 数据 包 。 

为 了 发 送 100 个 数据 包 ， 我 们 需要 经 历 10 个 这 样 的 周期 。 

因此 ，10 个 周期 所 需 的 时 间 =4.05 x 10=40.5 so 

经 过 这 些 时 间 之 后 ，100 个 数据 包 都 已 经 发 出 ， 并 已 经 收 到 了 91 个 ACK， 如 下 图 所 示 。 从 图 中 可 
以 看 出 ， 剩 余 的 9 个 ACK (AREAS HR) 会 以 0.05 秒 的 间隔 相继 到 达 


第 一 次 10 个 数据 包 ii if Tin 
tee ae 
40 secs 
发 送 端 时 间 轴 


接收 剩余 的 9 个 ACK 所 需 的 时 间 =9x0.05s=0.455s 
完成 消息 传输 的 总 时 间 =10 个 周期 所 需 的 时 间 + 接收 剩余 的 ACK 所 需 的 时 间 = 40.5+0.45 s = 40.95 s 


在 前 面 的 例子 中 ， 发 送 端 和 接收 端的 处 理 延迟 都 是 零 。 如 果 它 们 中 有 非 零 值 ， 则 会 增加 
绒 到 端的 总 延迟 ( 见 式 ( 13-1 ))。 数 据 包 的 流水 线 也 与 前 面 的 例子 类 似 。( 更 多 的 例子 请 参见 
本 章 末尾 的 习题 。) 


13.13 ”协议 层 功 能 总 结 


五 层 网 络 协议 栈 的 功能 总 结 如 下 : 

。 应 用 层 包括 了 HTTP, SMTP 以 及 FTP 等 协议 ， 以 便 文 持 包 括 Web 浏览 器 、 电 子 邮 件 、 
文件 上 传 下 载 、 即 时 通信 以 及 多 媒体 会 议 与 协作 等 特定 类 型 的 应 用 程序 。 操 作 系 统 中 
特定 的 网 络 通 信 库 ， 如 套 接 字 和 远程 过 程 调用 (Remote Procedure Call, RPC; 参见 
13.16 万)， 也 属于 这 一 层 。 

。 传输 层 为 应 用 程序 在 通信 两 端 之 间 提 供 消 息 传输 。 我 们 已 经 知道 这 一 层 的 功能 取决 于 
应 用 程序 对 于 服务 质量 的 要 求 。TCP 在 两 端 之 间 提 供 可 靠 的 面向 字 节 流 的 按 序 传输 ， 
并 包含 拥塞 控制 ， 而 UDP 提供 不 可 徘 且 没有 保障 的 乱 序 到 达 数 据 报 服务 。 

。 网 络 层 将 传输 层 传 来 的 数据 传递 到 目的 地 。 这 层 的 功能 包括 依据 链 路 层 协议 进行 分 组 / 
重组 、 路 由 、 转 发 ， 以 及 为 传输 层 提供 服务 模式 。 正 如 我 们 之 前 所 看 到 的 ， 作 为 守护 
进程 运行 的 路 由 算法 程序 负责 确定 到 达 目 的 地 的 路 由 并 维护 路 由 表 和 转发 表 。 

o 数据 链 路 层 回 网 络 层 提供 访问 物理 介质 的 接口 。 这 层 的 功能 包括 MAC 协议 、 依 据 物理 
层 的 线路 信息 将 数据 包 划 分 成 帧 、 错 误 检 测 〈 例 如 ， 在 以 太 网 中 检测 数据 包 冲 突 ， 或 者 
在 令 牌 环 网 络 中 检测 令 牌 丢失 )、 错 误 恢 复 (例如 ， 在 以 太 网 中 发 生 冲 突 之 后 的 退 避 算 
法 以 及 数据 包 重 传 ， 或 者 在 令 牌 环 网 络 中 重新 生成 令 牌 )。 

。 物理 层 涉 及 用 于 传输 的 物理 介质 的 介质 类 型 ( 铜 导线 、 光 纤 、 无 线 电 等 ) 中 的 机 械 电 气 细 
节 、 介 质 中 信号 的 性 质 ， 以 及 用 于 数据 链 路 层 中 MAC 协议 实现 的 信号 交换 的 具体 方式 。 


13.14 网络 软 件 与 操作 系统 
正如 我 们 之 前 在 13.1 节 中 所 提 到 的 ， 操 作 系 统 和 网 络 软件 之 间 有 3 个 强劲 的 接触 点 。 
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13.14.1 套 接 字库 


这 是 操作 系统 为 网 络 协 议 栈 所 提供 的 接口 。TCP/IP 是 我 们 日 常生 活 中 所 依赖 的 所 有 的 与 
因特网 相关 服务 的 根基 ， 包括 浏览 网 页 、 写 博客 、 即 时 通信 等 。 因 此 ， 多 了 人 解 一 些 TCP/IP 为 
分 布 式 应 用 程序 编程 所 提供 的 接口 是 有 意义 的 。 

当 你 编写 分 布 式 应 用 程序 时 ， 你 并 不 需要 直接 处 理 TCP/IP 中 的 复杂 情况 。 我 们 会 在 接 下 
来 的 段落 中 解释 这 是 为 什么 。 

如 果 你 观察 因特网 协议 栈 (COLA 13-5 )， 你 就 会 意识 到 应 用 程序 位 于 图 中 协议 栈 的 上 方 。 
操作 系统 为 分 布 式 应 用 程序 编程 提供 了 定义 良好 的 接口 。 例 如 ，UNIX 操作 系统 提供 套 接 字 
(socket) 作为 进程 之 间 通 信和 的 抽象 ( 见 图 13-42 )。 

图 13-42 表明 套 接 字 抽 象 与 两 个 进程 所 在 的 位 置 无 关 。 例 如 ， Pi P2 
这 两 个 进程 可 以 都 在 同一 个 处 理 器 上 执行 ， 或 者 在 共享 内 存 的 多 Pace 
处 理 器 的 不 同 处 理 器 上 (如 在 第 12 章 中 讨论 的 SMP) 执行 ， 或 者 
是 在 通过 网 络 连接 的 两 台 不 同 的 计算 机 上 执行 。 也 就 是 说 , 套 接 wise 
字 抽 象 与 实际 如 何 将 位 从 进程 P1 移动 到 进程 P2 无 关 。 eit Ma ei 

TCP/IP 等 协议 是 实现 套 接 字 抽象 的 工具 。 先 让 我 们 了 解 为 什 peer 
么 套 接 字 抽象 要 支持 多 种 下 层 协 议 。 从 进程 P1 和 进程 P2 的 观点 来 看 ， 这 是 无 关 紧 要 的 。 但 
是 从 效率 的 角度 来 看 ， 根 据 通信 两 端的 位 置 使 用 不 同 的 协议 是 更 好 的 。 例 如 ， 考虑 两 个 进程 
位 于 同一 个 处 理 器 上 或 者 位 于 一 个 SMP 中 的 不 同 处 理 句 上 ， 在 这 种 情况 下 ， 通 信永 远 不 会 经 
过 计算 机 外 的 外 部 线路 ， 许 多 低层 问题 (如 数据 包 丢 失 、 数 据 包 乱 序 到 达 以 及 传输 错误 ) 都 不 
会 存在 。 即 使 Pl 和 了 2 在 同一 局 域 网 (例如 ， 家 庭 网 络 ) 中 的 不 同 机 需 上 ， 数 据 包 丢失 的 概 
率 也 可 以 忽略 不 计 ， 因 此 基本 不 需要 担心 这 些 低层 问题 。 另 一 方面 ， 也 有 需要 使 用 复杂 的 协 
议 来 解决 这 些 低层 问题 的 情况 ， 例 如 ， 进 程 P1 在 你 宿舍 的 计算 机 上 执行 ， 而 进程 P2 在 校园 
网 中 的 工作 站 上 执行 。 

如 图 13-42 所 示 ， 通 信 所 使 用 的 通信 类 型 也 是 在 建立 通信 信道 时 要 考虑 的 问题 。 拿 邮政 
服务 做 比喻 ， 你 寄 出 一 张贴 了 邮票 的 明信片 ， 邮 局 并 不 能 保证 它 能 够 到 达 目 的 地 。 如 果 你 
需要 知道 收 件 人 是 否 实际 收 到 了 你 的 来 信 ， 你 得 付 更 多 的 钱 以 获取 信件 送 到 的 回执 。 类 似 
于 这 个 明信片 的 例子 ，P1 和 了 2 可 能 只 需要 偶尔 交换 简单 且 固 定 大 小 的 (通常 很 小 ) 数据 报 
(datagram)， 并 且 不 需要 确保 可 靠 。 另 一 方面 ， 图 13-42 也 可 以 表示 从 朋友 那里 下 载 电 影 ， 在 
这 种 情况 下 ， 两 端 之 间 的 通信 需要 传输 连续 的 流 (stream)， 并 且 需 要 可 靠 性 保障 。 通 信 信 道 
所 需要 的 通信 类 型 与 协议 的 选取 无 关 。 应 用 程序 的 属性 决定 了 通信 类 型 ， 而 通信 两 端的 物理 
位 置 以 及 物理 连接 情况 决定 了 使 用 的 协议 。 

在 UNIX 中 创建 套 接 字 时 ， 可 以 指定 所 需 的 套 接 字 属性 ， 包 括 要 使 用 的 特定 通信 类 型 
(如 数据 报 、 面 向 流 等 ) 与 协议 族 (如 UNIX 内 部 协议 族 、 网 络 协议 族 等 )。 

操作 系统 级 的 套 接 字 API 实现 细节 有 点 类 似 于 我 们 在 第 12 章 中 所 讨论 的 多 线程 库 的 实现 
细节 。 这 些 细 节 已 经 超出 了 本 书 的 范围 。 有 兴趣 的 读者 可 以 参考 讨论 这 些 问题 的 其 他 书 。 

其 他 被 广泛 使 用 的 操作 系统 也 提供 了 套 接 字 API， 例 如 Microsoft Windows (XP, Vista 和 
Win7 等 多 个 版 本 ) 和 Mac OS X。 


© < The Design and Implementation of the FreeBSD Operating System 》，Marshall Kirk McKusick, George 
V.Neville-Neil # [McKusick, 2004]- 
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13.14.2 ”在 操作 系统 中 实现 协议 栈 


在 当今 时 代 ， 无 论 操 作 系 统 为 网 络 编程 提供 了 什么 样 的 API， 它 还 需要 为 网 络 连接 提供 
协议 栈 中 不 同 层 的 具体 实现 。 协 议 栈 中 的 传输 层 和 网 络 层 通常 在 操作 系统 中 以 软件 形式 实现 ， 
而 协议 栈 的 链 路 层 〈( 即 第 2 层 ) 通常 在 硬件 中 实现 。 例 如 ， 你 的 笔记 本 电脑 多 半 会 有 一 块 以 
太 网 卡 ， 它 提供 协议 栈 第 2 层 的 功能 。 而 在 移动 设备 中 ， 无 线 网 卡 已 经 变 得 非常 常见 ， 这 些 
无 线 网 卡 实 现 了 它们 自己 的 链 路 层 协 议 ， 这些 协议 是 以 太 网 等 随机 访问 协议 的 变种 。 事 实 上 ， 
IEEE 的 无 线 局 域 网 协议 族 标准 都 出 自 包 含 了 以 太 网 的 IEEE 802 族 。 当 我 们 在 13.8.4 节 中 讨 
论 CSMA/CA 时 ， 已 经 简要 了 解 了 无 线 局 域 网 协议 。 我 们 把 无 线 局 域 网 协议 的 细节 讨论 留 给 
更 高 级 的 课程 。9 

我 们 已 经 看 到 ，TCP/P 是 在 当前 因特网 中 占据 主导 地 位 的 传输 层 / 网络 层 协议 组 合 。 相 
应 地 ， 标 准 的 操作 系统 (W UNIX, Mac OS 以 及 Microsoft Windows) 也 都 包含 了 TCP/IP 协 
议 栈 的 高 效 实 现 。 而 且 ， 大 多 数 关于 操作 系统 规范 与 调 优 的 新 的 研究 工作 也 会 使 用 协议 栈 作 
为 有 代表 性 的 例子 ， 以 验证 关于 操作 系统 机 制 的 新 的 研究 结果 。 

协议 栈 是 非常 复杂 的 软件 ,通常 是 需要 专业 程序 员 开 发 若干 人 年 ， 具 有 成 千 上 万 行 代码 
的 软件 ， 有 兴趣 的 读者 可 以 参考 完全 致力 于 这 个 主题 的 教科 书 。® 


13.14.3 网络 设备 驱动 程序 


如 果 不 简单 了 解 一 下 网 络 设备 驱动 程序 ,那么 关于 操作 系统 对 于 网 络 支持 的 讨论 将 是 不 
完整 的 。 网 卡 (NIC) 使 主机 能 够 连接 到 网 络 ， 一 台 主 机 也 能 有 多 个 网 络 接口 ， 这 取决 于 它 所 
连接 到 的 网 络 的 数量 ， 主 机 中 每 块 可 用 的 网 卡 也 都 在 操作 系统 中 有 相对 应 的 设备 驱动 程序 。 
正如 我 们 之 前 提 到 过 的 (参见 13.9 节 )， 网 卡通 常 包 含 协议 栈 中 链 路 层 的 一 些 硬件 功能 。 而 网 
卡 的 设备 驱动 程序 对 于 这 些 硬件 功能 进行 了 补充 ， 是 网 卡 能 够 完成 链 路 层 的 各 种 琐事 。 我 们 
在 第 10 章 中 讨论 了 用 于 高 速 O 的 DMA 控制 器 ， 网 卡 采用 了 DMA 引擎 ， 直 接 在 主机 内 存 
与 网 络 之 间 输 入 /输出 数据 。 但 是 网 络 IO 与 磁盘 1/0 之 间 有 一 点 根本 的 不 同 ， 磁 盘 IO 在 两 
个 方向 上 的 数据 移动 ( 即 到 / 从 磁盘 ) 都 是 由 操作 系统 发 起 的 ， 用 于 响应 一 些 用 户 级 或 系统 级 
的 需求 (例如 ， 打 开 文 件 或 者 处 理 页 错误 )。 再 考虑 网 络 ， 向 网 络 发 送 数 据 包 肯 定 是 由 用 户 级 
或 系统 级 的 需求 发 起 的 ， 但 是 操作 系统 不 能 够 控制 网 络 数据 包 的 到 达 。 因 此 ， 操 作 系 统 必 须 
要 在 任何 时 候 都 准备 好 处 理 这 种 可 能 事件 ， 这 就 是 网 卡 的 设备 驱动 程序 的 主要 任务 ， 它 实现 
了 一 组 衔接 操作 系统 与 网 卡 的 功能 。 

例如 ， 对 于 一 块 连接 主机 与 以 太 网 网 卡 的 网 卡 ， 相 应 的 设备 驱动 程序 包含 以 下 功能 : 

。 在 主机 内 存 中 分 配 / 释放 用 于 发 送 和 接收 数据 包 的 网 络 缓冲 区 (network buffer), 

。 当 有 数据 包 需 要 发 送 到 线路 中 时 ， 建 立 网 络 传输 缓冲 区 并 通过 网 卡 发 起 DMA 操作 。 

。 在 操作 系统 中 注册 网 络 中 断 处 理 程序 。 

。 为 网 卡 建立 网 络 接收 缓冲 区 ， 并 通过 DMA 将 收 到 的 网 络 数据 包 存 人 主机 内 存 中 。 

。 获 取 网 卡 的 硬件 中 断 ， 在 必要 时 上 行 调用 (参见 第 11 章 中 关于 上 行 调 用 的 讨论 ) 至 协 

议 栈 的 上 层 (例如 ， 将 数据 包 到 达 事 件 告知 上 层 )。 


昌 参见 Kurose 和 Ross 的 教科 书 ，Computer Networking: A Top Down Approach Featuring the Internet, Addison- 
Wesley [Kurose, 2006]， 这 本 书 很 好 地 覆盖 了 无 线 局 域 网 的 基本 技术 。 

© (TCP/IP Illustrated, Volume 2: The Implementation ( Addison-Wesley Professional Computing Series)), Gary R. 
Wright, W. Richard Stevens # [Wright, 1995]. 


图 13-43 展示 了 处 理 网 络 数据 包 到 达 时 硬件 与 软件 的 行为 。 因 为 网 卡 知道 由 设备 驱动 程 
序 为 接收 数据 包 申 请 的 网 络 缓冲 区 ， 所 以 它 可 以 立即 使 用 DMA 将 输入 的 数据 包 存 人 主机 内 
存 中 这 些 预先 分 配 的 缓冲 区 。 之 后 网 卡 使 用 处 理 器 的 硬件 中 断 机 制 (第 4 章 和 第 10 BE) 将 数 
据 包 到 达 事 件 告诉 设备 驱动 程序 。 设 备 驱动 程序 使 用 我 们 在 第 11 章 中 所 讨论 的 上 行 调 用 机 制 
将 输入 数据 包 告 知 协议 栈 上 层 。 对 于 更 多 的 详细 内 容 ， 有 兴趣 的 读者 可 以 参考 与 网 络 设 备 驱 
动 程序 开发 相关 的 文献 。9 698 
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图 13-43 ”网 络 数据 包 到 达 。 我 们 已 经 从 前 面 的 章节 中 熟悉 了 操作 系统 的 其 他 功能 ， 例 如 
CPU 调度 、 虚 拟 内 存 管理 以 及 文件 系统 管理 。 图 13-43 中 展示 了 用 于 文 持 网 络 
编程 的 操作 系统 中 协议 栈 各 层 以 及 当 有 网 络 数据 包 到 达 时 硬件 (NIC) 与 软件 
所 执行 的 操作 


13.15 ”使 用 UNIX 套 接 字 进行 网 络 编程 


为 了 使 关于 网 络 编程 的 讨论 更 加 具体 ， 让 我 们 从 应 用 程序 的 角度 来 仔细 看 看 UNIX 套 接 
字 如 何 工作 。 

在 UNIX 上 套 接 字 创建 函数 需要 3 个 参数 : 域 (domain)、 类 型 (type) 和 协议 (protocol). 

。 域 (domain): 这 个 参数 选取 通信 所 使 用 的 协议 族 。 例 如 ， 如 果 通 信 进 程 位 于 因特网 中 ， 
则 会 选择 IP 协议 族 ; 如 果 进 程 都 在 同一 台 机 器 或 同一 个 局 域 网 中 ， 则 会 选择 UNIX 内 
部 协议 族 。 

。 类 型 (type): 这 个 参数 指定 应 用 程序 所 需 的 属性 ， 如 数据 报 或 流 。 

。 HiX (protocol): 这 个 参数 在 协议 族 (由 域 参数 决定 ) 满足 所 需 属 性 (由 类 型 参数 决定 ) 
的 协议 中 指定 所 使 用 的 协议 。 

© Network Device Driver Programming Guide, http://developer.apple.com/documentation/DeviceDrivers/ 

Conceptual/NetworkDriver/NetDoc.pdf; 
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套 接 字 创建 函数 提供 这 些 参数 选择 是 为 了 通用 性 。 例 如 ， 在 特定 的 协议 族 (如 UNIX 内 
部 协议 族 ) 中 可 能 会 有 多 个 协议 满足 通信 类 型 的 需求 ， 实 际 上 也 可 能 有 且 仅 有 一 个 协议 满足 
需求 。 人 例如， 如果 是 IP 协议 族 和 流 类 型 ， 那么 TCP 可 能 是 唯一 可 选 的 传输 协议 。 尽 管 如 此 ， 
显著 分 离 的 选项 体现 了 抽象 的 力量 ， 这 是 我 们 在 这 本 书 中 一 直 强 调 的 。 

在 图 13-42 中 ， 两 个 端点 Pl 和 P2 是 对 称 的 ， 但 这 并 不 是 所 有 的 情况 一 一 至 少 通信 信道 
不 是 使 用 这 种 方式 建立 的 。 让 我 们 在 本 节 中 更 深入 地 了 解 一 些 这 方面 的 问题 。 

使 用 套 接 字 的 进程 间 通信 遵循 客户 端 / 服务 器 (client/server) 模式 。 使 用 套 接 字 的 通信 可 
以 设置 为 面向 连接 的 或 者 无 连接 的 。 正 如 之 前 所 提 到 的 ， 类 型 (type) 参数 会 在 套 接 字 创 建 时 
明确 这 些 属 性 。 

让 我 们 来 考虑 使 用 UNIX 套 接 字 的 面向 连接 的 通信 。 可 以 把 客户 端 与 服务 器 之 间 建 立 连 
接 的 过 程 比 作 拨打 电话 。 呼 叫 方 需要 知道 要 拨打 的 号 码 ， 接 听 方 可 以 接受 来 自任 何人 的 呼叫 。 
客户 端 就 是 呼叫 方 ， 服 务 器 就 是 接听 方 。 

让 我 们 进一步 考虑 这 个 比喻 。 服 务 器 对 于 进程 间 通 信 会 做 以 下 准备 : 


1) 创建 一 个 用 于 通信 的 套 接 字 ， 如 图 13-44 Pra. 服务 器 
意 这 使 服务 器 创建 一 个 通信 终端 ， 类 似 于 安装 了 一 台 还 没有 
与 外 界 建立 起 连接 的 电话 。 为 了 使 电话 可 用 ， 我 们 需要 先 获 anal 
得 一 个 电话 号 码 (这 也 涉及 从 服务 提供 商 获取 线路 连接 ) 并 
将 号 码 与 电话 关联 起 来 ， 这 是 下 一 个 步骤 。 图 13-44 服务 器 端的 套 接 字 调 用 


2 ) 与 比喻 中 的 电话 号 码 相对 应 的 是 一 个 名 称 (也 称 为 地 址 )， 一 个 与 套 接 字 相关 联 的 唯一 
标识 符 。 将 名 称 与 套 接 字 关 联 起 来 的 系统 调用 称 作 绑 定 (bind) 。 如 果 要 使 用 IP 协议 通过 因 特 
网 进行 通信 ， 则 名 称 包括 两 个 部 分 < 主机 地 址 ， 端 口号 >。 
主机 地 址 是 运行 服务 器 端 主机 的 IP 地 址 ， 端 口号 是 一 个 16 服务 器 
位 的 无 符号 数 。 在 执行 绑 定 操作 时 ， 操 作 系统 会 检查 服务 
器 指定 的 端口 号 是 否 已 经 被 占用 ( 见 图 13-45 )。 EEE 

当 完 成 绑 定 之 后 ， 可 以 把 名 称 传 给 想 与 此 服务 器 通信 
的 其 他 客户 端 。 如 果 是 电话 号 码 ， 你 可 能 会 将 它 发 表 在 一 图 13-45 AER RE 
本 电话 目录 中 ， 以 便 其 他 人 查看 。 在 客户 端 /服务 器 通信 的 情况 下 ， 类 似 的 事情 是 创建 一 个 
名 称 服务 器 (name server)。 名 称 服务 器 是 一 台 众 所 周知 的 机 絮 ， 潜 在 的 客户 端 通 过 访问 名 称 
服务 器 来 获取 服务 器 的 名 称 。 

3) 要 使 电话 能 够 接听 到 来 电 ， 当 然 需要 用 电话 线 将 电话 连接 到 墙 上 的 电话 插座 (来 自 服 
务 提供 商 的 线路 连接 )。 首 先 ， 你 需要 告诉 电话 公司 你 想 要 接听 来 电 以 及 是 否 想 要 ”呼叫 等 待 





功能 一 一 也 就 是 ， 你 希望 通过 电话 线路 同时 接受 多 少 个 呼 — 
叫 。 这 相当 于 服务 器 端 执行 监听 (listen) 系统 调用 。 它 告诉 
操作 系统 在 这 个 套 接 字 上 可 以 排 多 少 个 呼叫 。 NO 名 称 

4) 服务 器 端 为 了 完成 输入 连接 请 求 的 接收 ， 需 要 执行 套 接 字 
一 次 接受 (accept) 系统 调用 。 这 相当 于 在 电话 公司 开通 电 ”图 13-46 ”监听 并 接受 呼叫 的 服务 
话 服务 之 后 ， 通 过 电话 话 简 收 听 来 电 ， 之 后 再 将 话 简 放 回 原 器 套 接 字 


位 ， 以 等 待 新 的 来 电 。 见 图 13-46. 
现在 ， 让 我 们 看 看 客户 端 要 与 服务 器 建立 连接 需要 做 些 什 么 。 
1) 创建 一 个 客户 端 套 接 字 ， 如 图 13-47 所 示 。 这 相当 于 为 呼叫 方 获取 一 个 电话 。 


2) 为 了 接 通 电话 ， 呼 叫 方 需要 拨打 电话 号 码 。 客 户 端 使 用 连接 (connect) 系统 调用 来 完 
成 相同 的 事情 。 它 连接 客户 端 套 接 字 与 名 称 服务 器 发 布 的 名 客户 端 
称 ， 如 图 13-48 所 示 。 

客户 端 和 服务 硕 都 还 没有 完全 准备 好 通信 。 连 接 
(connect) 系统 调用 类 似 于 拨打 电话 号 码 ， 但 直到 接听 方 拿 起 
话 简 ， 呼 叫 过程 才 算 完成 。 服 务 器 端的 接受 (accept) 系统 调 ”图 13-47 客户 端的 套 接 字 调 用 
用 在 这 种 客户 端 - 服务器 情况 中 完成 类 似 的 事情 。 在 电话 呼叫 中 ， 需 要 拿 起 话筒 才能 建立 起 
连接 。 在 套 接 字 中 ， 服 务 吕 已 经 表示 愿意 接受 从 连接 中 传 来 的 呼叫 。 因 此 ， 如 图 13-49 所 示 ， 
操作 系统 负责 在 客户 闪 和 服务 需 之 间 完 成 连接 建立 操作 。 注 意 如 果 你 的 电话 使 用 了 呼叫 等 符 
功能 ， 你 能 够 在 与 别人 通话 时 知道 有 新 的 来 电 。 操 作 系 统 也 为 套 接 字 提 供 了 相同 的 功能 ， 它 
会 为 新 建立 的 连接 创建 一 个 新 数据 套 接 字 (new data socket)。 当 客户 端 呼叫 已 经 人 处 于 接受 状 
态 的 套 接 字 时 ， 操 作 系 统 会 隐 式 地 将 连接 请 求 排 队 。 


客户 端 服务 器 


套 接 字 
图 13-48 客户 端 执行 连接 (connect) 系统 调用 之 后 的 客户 端 一 服务 器 关系 
客户 端 服务 器 


数据 套 接 字 


图 13-49 ”连接 建立 之 后 的 客户 端 一 服务 器 关系 


套 接 字 


此 时 ， 客 户 端 和 服务 器 都 已 经 准备 好 以 对 称 的 方式 交换 消息 。 因 此 ， 虽 然 建立 连接 时 两 
端 并 不 对 称 〈 就 像 是 电话 呼叫 的 情况 )， 但 实际 的 通信 确实 是 对 称 的 。 

你 可 能 想 知 道 为 什么 客户 端 和 服务 器 都 需要 执行 套 接 字 (socket) 系统 调用 。 我 们 已 经 从 
前 面 的 章节 中 知道 ， 每 个 进程 都 在 它 自己 的 地 址 空间 中 执行 ， 每 个 进程 的 数据 结构 也 是 通过 
地 址 空间 中 的 系统 调用 创建 的 。 因 此 ， 在 每 个 通信 进程 的 地 址 空间 中 都 需要 有 套 接 字 抽象 的 
表示 ( 见 图 13-50 )。 所 有 其 他 的 系统 调用 〈 绑 定 、 监 听 、 接 受 、 连 接 ) 通过 操作 系统 和 网 络 协 
议 栈 使 两 个 套 接 字 连 接 在 一 起 ， 以 实现 图 13-42 中 的 情形 。 





客户 端 地 址 空间 服务 器 地 址 空间 
图 13-50 AP in- 服务 器 地 址 空间 中 的 套 接 字 


之 前 的 讨论 主要 集中 在 需要 建立 连接 的 流 类 型 的 套 接 字 ， 如 果 套 接 字 的 类 型 是 数据 报 ， 
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则 通信 会 变 得 非常 简单 。 在 这 种 情况 下 ， 服 务 器 既 不 需要 执行 监听 ， 也 不 需要 执行 接受 。 从 
客户 端 发 来 的 数据 报 被 简单 地 存 人 了 由 服务 器 创建 的 数据 报 套 接 字 中 。 同 样 ， 如 果 客 户 端 创 
建 了 数据 报 套 接 字 ， 则 它 可 以 在 此 套 接 字 上 简单 地 使 用 服务 器 端的 套 接 字 地 址 ( 即 主机 地 址 
和 端口 号 ) 进行 数据 的 发 送 与 接收 。 
KAZ, 无论 进 程 在 何 处 执行 ，UNIX 为 进程 间 通 信和 提供 了 以 下 几 种 基本 的 系统 调用 : 
。 socket (ETF): 创建 一 个 通信 终端 。 
© bind (HWE): 将 一 个 名 称 或 者 地 址 绑 定 到 套 接 字 上 。 
。 listen (监听 ): 在 套 接 字 上 监听 输入 的 连接 请 求 。 
e accept (接受 ): 在 套 接 字 上 接受 输入 的 连接 请 求 。 
e connect (连接 ) : 使 用 名 称 (或 地 址 ) 同一 个 远程 套 接 字 发 送 连 接 请 求 ; 如 果 服 务 器 已 
经 执行 了 接受 (accept) 系统 调用 ， 则 通过 为 连接 创建 一 个 数据 套 接 字 来 建立 连接 。 
o Tecv (接收 ): 通过 套 接 字 从 远程 的 对 等 节点 接收 输入 数据 。 
。 send (发 送 ): 通过 套 接 字 回 远程 的 对 等 节点 发 送 数据 。 
图 13-51 展示 了 客户 端 和 服务 需 之 间 用 于 建立 面 回 流 的 套 接 字 通 信 的 协议 。 监 听 系 统 调 
用 让 操作 系统 预先 知道 流 类 型 的 套 接 字 需要 同时 支持 多 少 个 连接 。 每 次 建立 新 的 连接 时 ( 客 
户 端的 连接 调用 与 服务 器 的 接受 调用 相 匹 配 )， 操 作 系 统 都 会 创建 一 个 新 的 数据 套 接 字 。 这 个 
新 的 数据 套 接 字 的 生命 周期 取决 于 连接 的 生命 周期 。 一 旦 客户 端 关闭 连接 ， 这 个 新 创建 的 数 
据 套 接 字 也 会 被 天 闭 。 
客户 端 服务 器 


创建 流 套 接 字 


与 < 端口 号 > 绑 定 





图 13-51 ” 流 套 接 字 上 的 数据 通信 。 服 务 器 创建 一 个 套 接 字 ， 并 绑 定 一 个 端口 号 ， 执 行 接 
受 (accept) 系统 调用 进行 阻塞 ， 以 表明 它 愿 意 接受 连接 请 求 。 客 户 端 也 创建 
一 个 套 接 字 ， 并 使 用 < 主机 地 址 ， 端 口号 > 连接 到 服务 器 。 操 作 系 统 为 新 建立 
的 连接 创建 一 个 新 的 数据 套 接 字 ， 客 户 端 与 服务 器 在 此 之 上 交换 数据 流 。 每 个 
连接 都 有 其 专用 的 数据 套 接 字 ， 当 客户 端 关闭 连接 时 ， 相 应 的 数据 套 接 字 也 会 
关闭 。 此 时 ， 服 务 器 可 以 返回 到 原始 的 流 套 接 字 并 等 待 新 的 连接 请 求 
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监听 (listen) Jal Ase SEMA ARREARS HERA Ll, “SCIPS EBRR SSA, ZA 
线程 可 以 在 同一 个 套 接 字 上 执行 接受 (accept) 调用 。 这 使 得 在 同一 个 套 接 字 上 能 够 同时 容 
纳 多 个 客户 端 - 服 务 需 连接 (每 个 连接 拥有 上 自己 独立 的 数据 套 接 字 )， 其 数量 只 受 限 于 监听 
(listen) 调用 所 指定 的 界限 。 

图 13-52 展示 了 客户 端 和 服务 需 之 间 用 于 建立 面 回 数据 报 的 套 接 字 通信 的 协议 。 注 意 当 
服务 天 绑 定 了 闯 口 号 之 后 ， 就 已 经 准备 好 在 数据 报 套 接 字 上 进行 发 送 /接收 。 同 样 ， 客 户 端 
不 需要 显 式 地 执行 连接 调用 ， 就 可 以 在 数据 报 套 接 字 上 开始 进行 发 送 和 接收 。 

使 用 UNIX 套 接 字 的 客户 端 一 服务 器 程 序 
的 示例 请 参见 附录 。 

还 有 一 些 问题 需要 引起 使 用 UNIX ERF 
来 实现 分 布 式 程序 的 程序 员 的 关注 ， 我 们 列举 
了 其 中 的 一 些 问 题 : 

。 如果 两 个 进程 的 套 接 字 属 性 ( 域 和 类 型 ) 

不 匹配 ， 那 么 是 否 还 能 进行 通信 ? 

© 服务 占 如 何 选 取 问 口号 ? 

。 在 UNIX RETH, 名称 会 转变 成 
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创建 数据 报 套 接 字 












与 < 端口 号 > 乡 定 - 
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AFA? 
。 FE Ae Pn EE PEAY RAN AE TE, 2 
发 生 什 么 ? 


接收 回复 
。 如 果 由 于 某 种 原因 客户 端 与 服务 副 之 间 M 


的 物理 链 路 中 断 了 ， 会 发 生 什么 ? 
。 多 个 客户 问 可 以 向 同一 个 名 称 成 功 地 执 


行 连接 (connect) 调用 吗 ? 图 13-52 ”数据 报 套 接 字 上 的 通信 。 当 服务 器 创 

这 些 问 题 的 答案 取决 于 调用 套 接 字 库 时 的 建 了 一 个 数据 报 套 接 字 并 绑 定 一 个 端 
确切 语义 ， 以 及 实现 套 接 字库 的 开发 者 所 做 的 a a mn 
选择 。 提 出 这 些 问 题 的 目的 仅仅 是 为 了 激发 读 行 数据 传输 。 客 户 端 不 需要 执行 连接 
者 的 兴趣 。 通 过 仔细 阅读 UNIX 系统 上 的 套 接 调用 ， 就 可 以 与 服务 大 进行 数据 交换 


字库 帮助 文档 9 ， 就 能 够 很 容易 地 找到 这 些 问题 的 答案 。 

操作 系统 使 用 合适 的 传输 协议 (适合 所 需 的 套 接 字 语 义 ) KREMER (socket) 系统 调 
用 。 套 接 字库 的 实现 细节 超出 了 本 书 的 讨论 范围 ， 对 这 些 细节 有 兴趣 的 读者 可 以 参考 更 高 级 
的 网 络 与 操作 系统 书籍 。 

当然 ， 我 们 掩盖 了 许多 烦琐 的 细节 ， 为 了 让 讨论 保持 简单 。UNIX 操作 系统 提供 了 许多 实 
用 程序 来 协助 使 用 套 接 字 进行 网 络 编程 。 

随 着 网 络 服务 器 (例如 ， 文 件 服务 器 和 Web 服务 器 ) 中 UNIX 操作 系统 的 普及 与 万 维 网 
(WWW) 的 出 现 ， 使 用 套 接 字 进行 网 络 编程 已 经 变 得 越 来 越 重 要 。 我 们 鼓励 有 兴趣 的 谈 者 去 
学 习 更 高 级 的 操作 系统 课程 ， 以 获取 使 用 套 接 字 进 行 分 布 式 编程 的 实践 经 验 并 学 习 如 何在 操 
作 系 统 中 构建 套 接 字 抽象 。 


O 参见 在 线 帮助 文档 http://www.freebsd.org/cgi/man.cgi. 
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13.16 网络 服务 与 高 层 协议 


让 我 们 以 一 个 具体 的 例子 来 了 解 网 络 应 用 程序 ， 如 文件 传输 协议 (File Transfer Protocol, 
FTP)。 这 些 服务 分 为 客户 端 和 服务 器 两 部 分 。 客 户 端 上 的 主机 通过 网 络 连接 到 远程 主机 ， 并 
使 用 传输 协议 (Mu, TCP/IP) 与 远程 主机 上 的 FTP 服务 器 进行 通信 。 当 文件 传输 完成 后 ， 
客户 端 和 服务 器 会 关闭 它们 之 间 的 网 络 连 接 。 用 于 广域网 (WAN) 中 的 其 他 网 络 应 用 程序 (如 
Web 浏览 器 和 电子 邮件 等 ) 也 执行 类 似 的 操作 。 

了 解 为 何 有 些 局 域 网 服务 与 广域网 服务 执行 的 

操作 完全 不 同 是 非常 有 趣 的 。 例 如 ， 我 们 经 常 在 日 
常 计算 中 使 用 文件 服务 器 。 当 我 们 打开 一 个 文件 时 
(例如 ， 使 用 UNIX 中 的 fopen)， 实 际 上 我 们 可 能 foo (args) 
是 通过 网 络 从 一 个 远程 文件 服务 器 访问 该 文件 。 然 
而 ， 这 样 的 局 域 网 服务 不 会 使 用 传统 的 网 络 协议 栈 。 
TE UNIX 操作 系统 中 它们 使 用 一 种 称 为 远程 过 程 调 3 
用 (Remote Procedure Call, RPC) 的 简单 协议 。 图 
13-53 展示 了 RPC 的 基本 思想 。 进 程 P1 正常 调用 过 
FE foo， 而 过 程 foo 通过 网 络 在 另 一 台 远 程 机 器 上 的 i 
进程 P2 中 执行 。 事 实 上，RPC 的 用 户 看 不 见 远程 过 。” 图 13-53 UNIX 中 的 远程 过 程 调用 (RPC) 
程 执行 。 

网 络 文件 系统 (Network File System, NFS) 存在 于 RPC 机 制 之 上 。 图 13-54 从 高 层 展示 
T NFS 等 网 络 工 具 的 交互 过 程 。 用 户 的 fopen 调用 转变 成 对 NFS 服务 器 RPC 调用 ， 并 在 服 
务 器 上 对 相应 文件 执行 文件 打开 系统 命令 。 


P2 
foo (args) 
返回 
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图 13-54 UNIX 网 络 文件 系统 (NFS) 


本 节 中 对 于 网 络 服务 与 高 层 协议 的 简要 讨论 引出 了 一 些 有 趣 的 问题 : 

1) 我 们 如 何 设计 RPC 系统 ? 

2) 与 本 地 过 程 调用 相 比 ， 远 程 过 程 调用 的 语义 是 什么 ? 

3 ) RPC 如 何 处 理 网 络 传输 中 的 故障 ? 

4) 我 们 在 第 11 章 中 已 经 看 到 了 文件 系统 的 实现 ， 在 实现 网 络 文件 系统 时 有 什么 样 的 语 
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义 差别 ? 
本 方 对 于 分 布 式 系统 这 个 迷人 的 领域 给 出 了 简要 的 介绍 ,我们 希望 读者 能 够 学 习 更 深入 
的 谍 程 ， 以 便 更 深入 地 了 解 分 布 式 系统 。 


小 结 


在 本 章 中 我 们 涵盖 了 计算 机 网 络 的 基础 知识 。 我 们 在 13.3 节 中 讨论 了 网 络 通信 所 需要 
的 支撑 软件 ， 并 在 13.4.1 节 中 介绍 了 五 层 网 络 协议 栈 。 网 络 协议 栈 的 核心 是 传输 层 ， 我 们 在 
13.6 节 中 对 其 做 了 详细 介绍 。 传 输 层 负 责 为 应 用 程序 提供 抽象 且 独 立 于 网 络 的 细节 ， 其 主要 
功能 是 确保 消息 按 序 传输 、 支 持 任意 大 小 的 消息 以 及 对 应 用 程序 屏蔽 消息 传输 中 的 数据 丢失 。 
我 们 说 明了 许多 传输 层 协议 ,它们 在 公平 性 、 可 靠 性 和 通信 信道 利用 率 方面 各 有 所 长 。 

我 们 的 传输 协议 讨论 从 简单 的 停止 并 等 待 协议 开始 (13.6.1 节 )， 结束 于 当今 因特网 所 使 
用 的 传输 协议 ( 13.6.5 节 )。 我 们 在 13.7 节 详 细 讨 论 了 网 络 层 的 功能 。 网 络 层 负责 为 网 络 中 的 
节点 提供 合理 的 寻 址 方案 (13.7.2 节 )， 其 中 包含 从 源 到 目的 地 为 消息 的 数据 包 计 算 路 径 的 路 
由 算法 (13.7.1 节 )， 并 为 数据 包 传 输 提 供 服务 模式 ( 13.7.3 节 )。 在 13.7.1 节 中 所 讨论 的 路 由 
算法 包括 Dijkstra 最 短路 径 算 法 、 距 离 和 撩 量 算法 以 及 分 层 路 由 。 我 们 在 13.7.3 节 中 涵盖 了 电 
路 交换 、 分 组 交换 以 及 报 文 交 换 这 3 种 使 用 网 络 资源 (如 源 与 目的 地 之 间 的 中 间 节 点 和 路 由 
ar) 的 方式 。 分 组 交换 已 经 被 因特网 广泛 使 用 ， 我们 讨论 了 分 组 交换 中 的 两 种 服务 模式 ， 虚 
电路 和 数据 报 。 我 们 在 13.8 节 中 讨论 了 链 路 层 技术 ， 并 特别 关注 以 太 网 ( 13.8.1 节 )， 以 太 网 
已 经 成 为 了 事实 上 的 局 域 网 标准 。 在 这 节 中 还 涵盖 了 其 他 的 链 路 层 技术 ， 如 令 牌 环 (13.8.5 
节 )、FDDI 和 AIM (13.8.6 节 )。 连 接 主机 与 物理 层 的 网 络 硬 件 的 讨论 在 13.9 节 。 协 议 分 层 
是 一 个 用 于 构建 系统 软件 的 模块 化 方法 ， 我们 在 13.10 节 中 讨论 了 网 络 协 议 栈 中 不 同 层 之 间 
的 关系 。 在 之 后 的 两 节 中 我 们 讨论 了 用 于 数据 包 传输 的 数据 结构 ( 13.11 节 ) 与 网 络 中 消息 传 
输 时 间 的 组 成 成 分 ( 13.12 节 )。 我 们 在 13.13 节 中 总 结 了 五 层 因特网 协议 栈 的 功能 。 

我 们 在 13.14 节 中 考虑 了 如 何在 操作 系统 中 实现 网 络 协议 栈 ， 包 括 套 接 字库 以 及 设备 驱动 
程序 的 讨论 ， 在 常见 的 操作 系统 中 它们 都 与 TCP/IP 协议 相关 。 我 们 在 13.15 节 中 直观 地 感受 了 
使 用 UNIX 套 接 字 的 网 络 编程 ， 在 13.16 节 中 简要 地 介绍 了 高 层 网 络 服务 (如 网 络 文件 系统 )。 

本 章 最 后 以 计算 机 网 络 的 历史 回顾 结尾 。 


历史 回顾 
我 们 以 早期 的 计算 作为 网 络 演 变 之 旅 的 开始 。 
从 电话 到 计算 机 网 络 


首先 让 我 们 回顾 电话 的 演变 历史 ， 因 为 计算 机 网 络 继承 了 电话 的 大 量 优点 。 在 20 世纪 
60 年 代 之 前 ， 电 话 设施 完全 是 模拟 的 。 也 就 是 说 ， 当 你 拿 起 电话 呼叫 某 人 时 ， 连 接 两 台 设 
备 的 线路 携带 着 实际 的 语音 信号 。 原 则 上 只 需要 将 一 对 耳机 连接 进 电 话 线路 就 可 以 徊 听 私 人 
谈话 。 在 20 世纪 60 年 代 ， 电 话 技术 从 模拟 切换 到 了 数字 。 在 这 种 系统 中 ， 电 话 设施 将 模拟 
语音 信号 转换 为 数字 数据 ， 并 通过 线路 发 送 比 特 。 现 在 的 电话 网 络 仍然 使 用 电路 交换 (参见 
13.7.3 节 ), 但 是 音频 信号 以 0 和 1 的 形式 发 送 。 在 接收 端的 电话 设施 将 数字 数据 转换 回 原来 
的 模拟 语音 信号 ， 并 通过 电话 将 语音 信和 号 提供 给 终端 用 户 〈 见 图 13-55). 
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709 图 13-55 ”使 用 电路 交换 的 数字 电话 


在 计算 机 的 演变 历史 中 ，20 世纪 60 年 代 是 大 型 机 (mainframes) 的 时 代 。 这 些 机 器 运 
行 在 面向 批 处 理 的 多 道 程序 设计 环境 中 ， 并 使 用 穿孔 卡片 (punched card) 作为 输入 /输出 的 
介质 。 之 后 ， 基 于 阴极 射线 管 (CRT-based) 的 显示 设备 和 键盘 取代 了 穿孔 卡片 ， 成 为 用 户 与 
计算 机 进行 交互 的 输入 /输出 介质 。 这 开启 了 大 型 机 的 交互 ( interactive) 计算 与 分 时 (time- 
shared) 操作 系统 的 时 代 ( 见 图 13-56 )。 





图 13-56 ”连接 到 一 台大 型 机 的 多 个 终端 


伴随 着 电话 的 发 展 ， 阴 极 射 线 管 的 出 现 开 辟 了 一 种 新 的 可 能 性 一 一 显 示 设 备 不 需要 靠 
近 大 型 计算 机 ， 它 可 以 位 于 一 个 远程 位 置 ， 如 用 户 的 家 中 。 毕 竟 电 话 设施 也 携带 数字 数 
据 ， 且 它 并 不 真正 关心 线路 上 的 比特 到 底 是 语音 还 是 数据 。 但 不 幸 的 是 ， 电 话 设施 假定 输 
入 /输出 是 模拟 的 (因为 它 本 来 用 于 传输 语音 )， 即 使 其 内 部 通信 也 全 部 使 用 数字 。 因 此 ， 
在 远程 显示 设备 与 电话 设施 之 间 存 在 一 个 缺失 环节 ， 这 也 同样 存在 于 电话 设施 与 大 型 机 之 
间 ( 见 图 13-57 ) 。 这 个 缺失 环节 就 是 调制 解 调 器 (modem)， 它 可 以 在 发 送 端 将 数字 数据 
转换 为 模拟 信号 ， 并 在 接收 端 将 模拟 信号 转换 为 数字 数据 。 当 然 ， 数 据 传输 的 两 个 方向 都 
需要 这 个 数字 一 模拟 - 数字 转换 过 程 。 

1962 年 ，AT&T 贝尔 实验 室 (AT&T Bell Labs) 推出 了 第 一 个 商业 化 的 全 双 工 (full- 
duplex) 调制 解 调 器 ， 它 在 每 一 端 都 能 同时 进行 调制 和 解 调 ( 见 图 13-58 )。 这 标志 着 电信 
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(telecommunication) 的 诞生 。1977 4F, Dennis Hayes 发 明了 PC 调制 解 调 器 ， 将 终端 和 调制 
解 调 带 之 间 的 通信 语言 标准 化 。 这 为 在 线 与 因特网 行业 的 萌芽 和 成 长 葛 定 了 基础 ， 并 确定 了 
调制 解 调 需 的 工业 标准 。 


模拟 数据 









失去 链接 ? 上 “| 数字 数据 


图 13-57 即使 电话 设施 内 部 也 使 用 数字 数据 ， 但 电话 设施 的 输入 /输出 是 模拟 的 (语音) 
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图 13-58 ”调制 解 调 右 将 终 问 连接 到 大 型 机 


因特网 的 演变 


许多 计算 机 先驱 都 热衷 于 创造 计算 机 远 距离 通信 技术 ， 军 方 出 于 战略 原因 也 对 实现 这 个 
技术 很 感 兴趣 。 从 20 世纪 60 年 代 初 期 开始 ， 伴 随 着 使 用 电话 线 连 接 终 端 与 大 型 机 的 调制 解 
调 器 的 发 展 ， 学 术 界 与 工业 界 中 都 有 许多 敏锐 的 头脑 思考 如 何 远 距离 连接 计算 机 。1968 F, 
一 个 美国 联邦 资助 的 机 构 美国 国防 部 高 级 计划 署 (Advanced Research Projects Agency, ARPA) 
在 这 些 学 术 界 与 工业 界 的 敏锐 头脑 的 帮助 下 ， 起 草 了 一 份 关于 第 一 个 计算 机 网 络 的 计划 。 第 
一 个 称 为 高 级 计划 署 网 络 ( Advanced Research Projects Agency Network, ARPAnet) 的 分 组 交 
换 计算 机 网 络 连 接 了 4 台 计 算 机 ， 第 一 台 在 加 利 福 尼 亚 大 学 洛杉矶 分 校 (UCLA)， 第 二 台 在 
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斯 坦 福 大 学 ( Stanford)， 第 三 台 在 加 利 福 尼 亚 大 学 圣 巴巴 拉 分 校 ( UC-Santa Barbara), BOA 
在 犹他 大 学 (University of Utah)。 这 个 网 络 中 的 “路 由 器 ”实际 上 是 接口 报 文 处 理 机 (Interface 
Message Processor, IMP), € H BBN 公司 (Bolt，Beranak，and Newman, Inc.) 制造 。IMP 
系统 的 体系 结构 要 求 硬件 与 软件 要 能 细致 平衡 ， 并 在 这 些 计 算 机 中 作为 存储 转发 的 分 组 交换 
机 使 用 。IMP 之 间 使 用 调制 解 调 右 以 及 租用 的 电话 线 相互 连接 。1969 年 ，ARPAnet 进行 了 首 
次 测试 ， 网 络 大 师 Leonard Kleinrock 从 UCLA 向 斯 坦 福 大 学 成 功 发 送 了 第 一 条 网 络 消息 。 

当然 ， 经 过 这 次 最 初 的 测试 之 后 ，ARPAnet 很 快 就 道 勃 发 展 成 了 当今 的 因特网 。 其 中 一 
个 主要 的 发 展 是 可 靠 通信 协议 TCP/IP， 它 由 网 络 先驱 Vinton Cerf 和 Robert Kahn 发 明 。 他 们 
在 2004 年 被 授予 计 算 机 科学 的 最 高 奖项 ， 图 灵 奖 (Turing Award)， 以 表彰 他 们 在 网 络 通信 协 
议 发 展 中 的 贡献 。 我 们 需要 注意 ， 从 20 世纪 70 年 代 中 期 到 70 年 代 未 ， 本 章 所 讨论 的 基本 网 
络 思想 ， 包 括 传输 协议 与 存储 转发 分 组 交换 路 由 ， 都 完整 地 用 于 因特网 。20 世纪 80 FRE 
H, TCP/IP 协议 栈 得 益 于 加 利 福 尼 亚 大 学 伯克利 分 校 ( University of California, Berkeley) 的 
软件 分 发 工作 ， 进 入 了 UNIX 操作 系统 。 随 后 由 于 UNIX 的 普及 ,网 络 协 议 栈 先后 出 现在 台 
式 机 市 场 和 服务 器 市 场 ， 并 很 快 成 为 各 种 版 本 UNIX 中 的 一 个 标准 功能 。 即 使 是 IBM 也 在 20 
世纪 80 年 代 初 期 决定 与 威斯康星 大 学 ( University of Wisconsin-Madison) 合作 ， 将 网 络 协 议 
栈 纳 入 它 的 VM 操作 系统 。。 因 此 ， 几 乎 所 有 主要 的 计算 机 供应 商都 在 他 们 的 计算 机 中 采用 
了 网 络 协议 栈 作 为 标准 。 但 是 ， 因 特 网 在 20 世纪 90 年 代 后 期 才 真正 成 为 一 个 家 喻 户 晓 的 名 
字 ， 有 两 个 原因 导致 了 这 段 时 间 延 迟 。 第 一 ， 当 时 的 计算 机 并 没有 普及 到 个 人 ， 直 到 PC 被 
发 明 并 在 商业 上 获得 成 功 。 第 二 ， 当 时 在 因特网 上 没有 杀手 级 应 用 ， 直 到 万 维 网 的 诞生 。 今 
天 ， 即 使 是 我 们 的 奶奶 都 可 能 会 告诉 我 们 一 台 没 有 连接 到 因特网 的 计算 机 实际 上 没有 什么 用 
处 。 因 特 网 的 爆炸 性 增长 也 催生 了 许多 公司 ， 如 专注 于 生产 专业 路 由 需 的 思科 (CISCO ) 。 

当然 ， 因 特 网 的 演变 历史 完全 足够 写成 一 整 本 书 ， 但 是 我 们 的 目的 仅仅 是 概述 目前 为 止 
我 们 所 经 历 的 旅程 。 我 们 只 是 简单 地 从 网 络 的 演变 来 体会 贯穿 本 书 的 3 个 主题 一 一 体系 结构 、 
操作 系统 以 及 网 络 。 


个 人 计算 机 与 局 域 网 的 出 现 


1972 年 ， 一 家 名 为 施乐 的 文案 管理 公司 (Xerox Corporation) 设计 出 了 世界 上 第 一 台 个 人 
计算 机 (Personal Computer, PC), %0 Alto, ELA Palo Alto 研究 中 心 (PARC) 命名 。 

20 世纪 70 年 代 中 期 ， 在 施乐 公司 PARC 工作 的 Metcalfe 和 Boggs 发 明了 以 太 网 ， 以 便 
使 一 栋 建 筑 内 的 计算 机 能 够 相互 通信 。 这 标志 着 局 域 网 (LAN) 的 诞生 。 但 具有 讽刺 意味 的 
是 ， 施 乐 公司 从 来 没有 销售 PC 或 以 太 网 技术 。 其 他 公司 ， 如 Apple 和 IBM， 捡 起 了 PC 的 想 
法 ， 并 改变 了 历史 。1979 年 ，Metcalfe 创办 了 3Com 公司 以 发 展 局 域 网 市 场 ， 并 成 功 地 说 服 
了 计算 机 行业 采用 以 太 网 作为 局 域 网 标准 。 


局 域 网 的 演变 


粗 缆 网 络 (thicknet) 以 太 网 的 物理 介质 是 同 轴 电 缆 (coaxial cable) 〈 见 图 13-59 )， 最 内 
层 的 厚 铜 线 承载 信号 ， 外 层 的 同 轴 导 体 接 地 (由 白色 绝缘 层 分隔 )。 最 早期 的 以 太 网 使 用 了 粗 
同 轴 电 缆 〈 因 此 称 为 粗 缆 网 络 ) 和 刺 穿 式 搭 接 器 (vampire taps) ( 见 图 13-60) 来 连接 每 台 计 算 
机 。 同 轴 电 缆 贯 穿 整个 复杂 的 办 公 室 ， 把 所 有 的 计算 机 连接 在 一 起 。 连 接 办 公 室 计算 机 与 以 


”这 本 书 的 第 一 作者 在 威斯康星 大 学 读 研 究 生 时 ， 在 这 个 IBM 项 目 中 实现 了 邮件 传输 协议 SMTP. 
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太 网 的 是 连接 单元 接口 (Attachment Unit Interface, AUI) 电缆 ， 其 长 度 至 多 可 达到 SOK, RH 
们 习惯 使 用 xBASEy 表示 法 来 表示 以 太 网 连接 的 类 型 。 例 如 ， > 
LOBASES 是 指 以 太 网 支持 10 JK EER / 秒 的 数据 传输 速率 ， 使 J 
用 基带 信和 号， 任意 两 台 计 算 机 之 间 的 最 大 距离 为 500 米 。 使 用 
刺 罕 式 搭 接 器 的 粗 缆 网 络 在 1979 年 ~ 1985 年 使 用 。 

细 缆 网 络 (thinnet) 顾名思义 ， 这 种 以 太 网 使 用 细 同 轴 电 
缆 作 为 以 太 网 介质 ， 并 使 用 BNC 接头 9 将 计算 机 连接 到 同 轴 电 
缆 。 由 于 电缆 相对 较 细 (这 意味 着 更 大 的 电阻 ， 因 此 信号 随 距 miesa MORLE 
ARTERE E), MARN ETT ALS A KS 200 米 。 如 图 13-61 所 示 ， 
逻辑 总 线 将 这 些 电缆 连接 成 菊花 链 (daisy chain)。 细 缆 网 络 (数据 传输 速率 为 10 兆 比特 / 秒 
的 细 缆 网 络 表示 为 10BASE2 ) 盛行 于 1985 ~ 1993 年 之 间 。 
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AMP 粗 缆 
sp eae ( 刺 穿 式 ) 搭 
15 针 AUI 连接 器 Hee 
介质 访问 单元 
附加 单元 接口 
N 阳 连 接 需 
SOO 端 接 器 
图 13-60 “计算 机 通过 刺 穿 式 搭 接 天 连接 到 以 太 网 同 轴 电 缆 。 通 过 同 轴 电 线 连 接 的 任意 两 


个 节点 之 间 的 最 大 距离 为 500 米 
计算 机 使 用 BNC 接头 的 10-base-2 同 轴 以 太 网 电缆 


BNC T 型 接头 
图 13-61 菊花 链 形式 的 细 缆 10BASE2 以 太 网 


快速 以 太 网 (fast Ethernet) 采用 菊花 链 形 式 的 局 域 网 会 出 现 维护 问题 。 例 如 ， 即 使 只 有 
一 个 BNC 接头 松 落 ， 也 会 破坏 整个 局 域 网 。 电 路 设计 的 发 展 以 及 超大 规模 集成 电路 ( VLSI) 
改变 了 这 一 局 面 。 在 20 世纪 90 年 代 初 期 电气 工程 师 设 计 出 了 和 集线器， 它 是 一 个 多 路 复 


O BNC 接头 是 一 种 很 常见 的 视频 连接 方法 。 其 缩写 表示 卡 口 锁 (Bayonet mount locking) 以 及 发 明 者 的 名 称 


(Neill and Concelman ) 。 
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Hir /收发 项 。 集 线 器 在 逻辑 上 等 价 于 一 条 总 线 ， 它 有 多 个 端口 ， 每 台 计 算 机 都 连接 到 其 中 
一 个 端口 。 随 着 电话 和 模块 化 插口 ( 称 为 RJ45 接头 ) 的 发 展 ， 以 太 网 改 为 使 用 类 似 于 电话 
线 的 双 绞 线 ( twisted pair of wires)， 线 路 两 端 使 用 RJ45 接头 连接 计算 机 与 集线器 ( 见 图 13- 
32), REEE TT ARMM. WERKA LAN 只 需要 简单 地 将 计算 机 连接 到 集 线 
复 ， 并 将 集线器 连接 在 一 起 ( 见 图 13-33 )。 集 线 器 在 逻辑 上 将 所 有 的 计算 机 连接 到 了 一 条 总 
线 上 。 电 级 的 长 度 也 变 得 无 关 紧 要 ， 因 为 计算 机 只 需要 连接 到 短 距 离 ( 几 十 米 ) 内 的 集线器 。 
100BASE-T (T 表示 双 绞 线 ) 通常 称 为 快速 以 太 网 ， 是 指 拥 有 100 兆 比 特 / 秒 的 数据 传输 速率 ， 
使 用 双 绞 线 连接 计算 机 与 集线器 的 以 太 网 。 

1GBase-T 与 10GBase-T 吉 比 特 以 太 网 自 2009 年 起 就 成 为 局 域 网 互 连 的 标准 。 支 持 
高 带宽 网 络 连 接 的 网 卡 使 用 双 绞 线 连接 主机 与 交换 机 。 双 绞 线 的 最 大 长 度 为 100 米 。 


练习 题 


1. 分 别 从 通信 的 两 个 方向 描述 调制 解 调 器 的 功能 。 

2. 对 比 以 太 网 和 令 牌 环 网 络 。 

3. 描述 令 牌 环 网 络 的 基本 功能 。 

4. CSMA/CD 这 个 缩写 是 什么 意思 ， 描 述 这 个 协议 。 

5. 区 分 无 线 以 太 网 协议 和 有 线 以 太 网 协议 。 

6. CSMA/CA 中 的 冲突 避免 是 什么 ， 它 是 如 何 实现 的 ? 

7. 对 比 以 下 设备 : 网 卡 、 集 线 器 、 中 继 器 、 网 桥 、 交 换 机 、 路 由 右 。 

8. 对 比 网 络 协议 栈 与 OSI 七 层 模 型 。 

9. 我 们 为 什么 需要 网 络 协议 ? 

10. 区 分 电路 交换 和 虚 电 路 。 

11. 一 个 知识 渊博 的 计算 机 工程 师 设计 了 一 种 使 用 网 桥 制造 的 交换 机 (如 本 章 所 讨论 的 ), 但 为 了 节省 成 

本 ， 他 使 用 了 中 继 器 来 蔡 代 网 桥 。 你 会 买 这 样 的 交换 机 吗 ? 为 什么 会 或 者 为 什么 不 会 ? 

12. 滑动 窗口 的 目的 是 什么 ? 

13. TCP/IP 等 协议 如 何 处 理 乱 序 到 达 、 数 据 包 丢失 ， 以 及 重复 的 数据 包 等 问题 ? 

14. 为 什么 会 发 生 网 络 拥塞 ，TCP 怎么 处 理 网 络 拥塞 ? 

15. IP 网 络 指 的 是 什么 ? 假设 你 要 创办 一 家 公司 ， 需 要 将 2000 台 计 算 机 连接 到 因特网 ， 你 如 何 向 ISP 申 

请 IP HOE? 你 公司 的 网 络 地 址 如 何以 点 分 十 进 制 表示 法 表示 ? 

16. 校 验 和 如 何 使 用 ， 它 为 什么 是 必要 的 ? 

17. 一 条 消息 有 13 个 数据 包 ， 从 源 向 目的 地 发 送 一 个 数据 包 的 时 间 是 2 毫秒 。 假 设 发 送 数据 包 和 接收 
ACK 的 时 间 与 介质 中 的 传播 时 间 相 比 可 以 忽略 不 计 ， 且 没有 发 生 数据 包 丢 失 。 那 么 窗口 大 小 为 5 的 
滑动 窗口 协议 需要 多 少时 间 来 完成 数据 传输 ? 
消息 大 小 =1900 Kb 
包头 大 小 =1000b 
数据 包 大 小 =20 Kb 
线路 带宽 =400 000 b/s 
传播 时 间 =2 s 
窗口 大 小 =8 
发 送 端 的 处 理 延迟 =0 
接收 端的 处 理 延迟 =0 


— 
o0 
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ACK 大 小 = 忽略 不 计 ( 视 为 0 )。 
假设 网 络 中 没有 错误 并 且 数 据 包 按 序 到 达 ， 那 么 完成 消息 传输 总 共 需 要 多 少时 间 ? 
[提示 : 注意 窗口 大 小 决定 了 在 任意 时 刻 处 于 传输 状态 中 的 数据 包 的 最 大 数量 。 当 所 有 数据 包 


都 已 经 发 送出 去 之 后 ， 发 送 端 就 会 开始 等 待 剩余 的 ACK 到 达 以 完成 消息 传输 。] 716 
19. 考虑 下 列传 输 层 和 网 络 层 条 件 : 


数据 包 大 小 =20 000 b 

ACK 大 小 = 忽略 不 计 ( 视 为 0) 

(单独 确认 每 个 数据 包 ) 

传输 窗口 大 小 =20 

发 送 端的 处 理 延迟 =0.025 s 每 个 数据 包 (不 包括 ACK) 

接收 端的 处 理 延 迟 =0.025 s 每 个 数据 包 (不 包括 ACK) 

数据 包 丢 失 几 率 =0% 

数据 包 出 错 几 率 =0% 

线路 带宽 =400 000 b/s 

传播 时 间 =4 s 

这 个 传输 层 要 完成 400 个 数据 包 的 传输 (包括 接收 ACK 包 ) 总 共 需 要 多 少时 间 ? 
[提示 : 注意 从 发 送 端的 工作 周期 来 看 ， 所 有 的 端 到 端 延迟 成 分 (如 13.12 节 中 的 式 (13-1 ) 所 


示 ) 都 可 以 混合 在 一 起 。] 
20. 下 面 是 一 个 数据 包 包头 的 各 字段 大 小 : 
目的 地 址 8B 
源 地 址 8B 
消息 中 数据 包 数 4B 


序号 


4B 


实际 数据 包 大 小 4B 

检验 和 4B 

假设 数据 包 的 最 大 大 小 为 1100 字 节 ， 计 算数 据 包 的 最 大 有 效 载 集 。 
21. 考虑 下 列 条 件 : 


RIF Nig FF FA =1 ms 

消息 大 小 =200 000 b 

线路 带宽 =100 000 000 b/s 

传播 时 间 =2 ms 

接收 端 开销 =1 ms 

计算 观测 到 的 带宽 。 消 息 传输 时 间 由 发 送 端 开销 、 传 输 延 迟 、 传 播 时 间 以 及 接收 端 开 销 组 成 。 


忽略 ACK. 717 
22. 考虑 下 列 条 件 : 


消息 大 小 =100 000 B 


包头 大 小 =100 B 
数据 包 大 小 =1100 B 
假设 有 10% 的 数据 包 会 丢失 ， 要 完成 消息 传输 总 共和 需要 发 送 多 少 个 数据 包 ? 忽略 小 数 部 分 的 丢 


包 概 率 。 和 忽略 ACK. 
23. 考虑 一 个 使 用 累积 ACK 的 可 靠 的 流水 线 传输 协议 。 其 窗口 大 小 为 10。 接 收 端 根据 以 下 规则 发 送 
ACK: 


718 
l 
719 
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© 如 有 果 按 序 接收 到 10 个 连续 的 数据 包 ， 就 发 送 一 个 ACK， 从 而 使 发 送 端 能 够 向 前 推进 滑动 窗口 。 

。 如果 接收 到 的 数据 包 的 序号 与 预期 不 符 ， 则 发 送 一 个 当前 已 经 收 到 的 最 高 序号 的 数据 包 的 ACK。 

a. 发 送 端 发 送 了 100 个 数据 包 ， 每 10 个 数据 包 中 会 有 1 个 在 传输 中 丢失 。 假 设 没 有 ACK BER. 
要 完成 消息 传输 实际 需要 发 送 多 少 个 ACK 包 ? 

b. 如 果 不 使 用 累积 ACK， 需 要 发 送 多 少 个 ACK 包 ? 即 假设 此 协议 对 每 个 数据 包 进 行 单 独 确认 ; 如 
果 收 到 一 个 乱 序 的 数据 包 ， 则 重新 发 送 之 前 的 最 后 一 个 ACK 包 。 


参考 文献 注释 和 扩展 阅读 


1989 年 ，Tim Berners-Lee 发 明了 万 维 网 [Berners-Lee，1989]。 然 而 连接 网 址 的 点 却 由 来 已 久 。 
1945 年 ， 一 篇 题 为 “As We May Think” 的 文章 描述 了 Vannevar Bush 的 远见 ， 他 预言 了 一 个 由 设备 〈 称 
为 memex) 构成 的 复杂 的 信息 交流 网 络 以 扩展 人 大 脑 的 未 来 [Bush，1945]。20 世纪 60 年 代 ，3 个 不 同 
的 研究 小 组 (MIT, Rand Institute 以 及 National Physical Laboratory in England) 分 别 独立 地 发 明了 分 组 
交换 [Baran，1964 ; Kleinrock，1961 ; Kleinrock，1964]， 它 是 因特网 数据 通信 技术 的 核心 。1969 年 ， 
BBN 科技 制造 了 第 一 代 分 组 交换 机 ， 称 为 接口 报 文 处理 机 ( Interface Message Processor，IMP)， 它 使 计 
算 机 能 够 相互 通信 。1969 年 年 底 ，ARPAnet 9 中 的 4 个 节点 成 功 通过 IMP 实现 连接 ! 20 世纪 70 年 代 
初期 ， 除 了 ARPAnet， 还 出 现 了 其 他 几 个 分 组 交换 网 络 ， 如 ALOHAnet[Abramson, 1970] 以 及 BBN 公 
司 推出 的 ARPAnet 的 商业 版 本 Telenet。 在 此 期 间 ，Robert Metcalfe 在 他 1973 年 的 博士 论文 中 提出 了 
以 太 网 的 原理 83， 这 是 此 后 以 太 网 发 展 的 起 点 。 此 时 ， 连 接 所 有 这 些 独 立 的 网 络 岛屿 的 时 机 已 经 成 熟 ， 
Vincent Cerf 与 Robert Kahn 完成 了 这 个 开拓 性 的 工作 [Cerf，1974]， 在 其 中 他 们 提出 了 网 络 互 连 的 体系 
结构 ， 于 是 我 们 今天 所 知道 的 因特网 诞生 了 。 这 个 体系 结构 指定 了 TCP 作为 主要 的 传输 协议 ， 它 推动 
因特网 发 展 至 今 。e 所 有 的 这 些 发 展 ， 再 加 上 计算 机 与 网 络 的 硬件 与 软件 的 进步 ， 促 成 了 Tim Berners- 
Lee 发 明 的 万 维 网 。 

Berkeley UNIX 中 的 TCP/IP 协议 栈 实现 细节 可 以 在 [McKusick，1996] 中 找到 。[Stevens，1994 ; 
Wright, 1995] 这 些 书 是 细致 学习 TCP/IP 协议 及 其 实现 的 极 好 资源 。 对 于 淘 望 了 解 更 多 的 同学 ， 可 以 参 
考 计算 机 网 络 方面 的 许多 优秀 教科 书 [Kurose，2006 ; Tanenbaum，2002]。 对 网 络 编程 感 兴趣 的 同学 会 
发 现 [Comer，2000; Stevens, 2003; Bryant, 2003] 这 些 教科 书 是 极 好 的 资源 . 


© ARPA 全 称 为 Advanced Research Projects Agency， 而 ARPAnet 可 以 认为 是 当今 因特网 的 始祖 。 


© Metcalfe 和 Boggs 在 1976 年 发 表 了 描述 以 太 网 协议 的 论文 [Metcalfe，1976]。 
四” 想 要 了 解 因特网 横 跨 1962—1992 的 30 年 历史 ， 请 访问 http://www.computerhistory.org/internet_history/。 
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本 书 已 经 走 完 “ 计 算 机 内 部 ”( inside the box) 之 旅 。 应 该 回顾 一 下 我 们 所 涵盖 的 主题 ， 
并 看 清 系 统 软件 与 硬件 之 间 的 密切 关系 。 
14.1 处 理 辟 设计 


我 们 已 经 看 到 ， 高 级 语言 结构 在 指令 集 设计 与 处 理 右 体系 结构 的 功能 设计 中 起 到 了 关键 
作用 。 表 14-1 总 结 了 影响 处 理 需 体系 结构 决策 的 高 级 语言 结构 与 功能 。 


表 14-1 高 级 语言 与 体系 结构 功能 


高 级 语言 结构 / 功能 体系 结构 功能 
表达 式 算术 / 逻辑 指令 ， 寻 址 模式 
数据 类 型 不 同 的 操作 数 粒度 ， 多 种 精度 的 算术 / 逻辑 指令 
条 件 语句 ， 循 环 有 条 件 和 无 条 件 的 分 支 指令 
过 程 调 用 /返回 栈 ， 链 接 寄存 器 
系统 调用 ， 错 误 条 件 陷入 ， 异 常 
高 级 语言 程序 的 执行 效率 (表达 式 以 及 参数 传递 等 ) 通用 寄存 器 


我 们 已 经 看 到 ， 当 体系 结构 被 完全 指定 后 ， 仍 然 会 有 好 几 种 实现 选择 ， 如 简单 的 设计 与 
流水 线 设 计 。 公 平地 说 ,我 们 只 触及 了 微 体系 结构 这 个 有 趣 领 域 的 表面 。 希望 我 们 已 经 充分 
地 激发 了 读者 的 兴趣 ， 使 他 们 能 够 目 行 深 入 挖掘 这 个 迷人 的 区 域 。 


14.2 ”进程 


进程 这 一 概念 作为 一 种 方便 的 抽象 ， 用 于 记忆 所 有 与 正在 运行 程序 的 相关 细节 。 我 们 知 
道 处 理 需 在 同一 时 间 只 能 执行 一 个 程序 。 操 作 系统 提供 了 每 个 进程 执行 在 各 目 处 理 器 上 的 假 
象 。 为 了 方便 操作 系统 制造 这 种 假象 ， 体 系 结构 提供 了 陷入 与 中 断 机 制 来 从 当前 执行 的 程序 
取 回 控制 权 。 操 作 系 统 通 过 这 些 机 制 来 获取 处 理 器 的 控制 权 ， 以 做 出 调度 决策 来 决定 接 下 来 
执行 的 用 户 程序 。 我 们 已 经 看 到 许多 操作 系统 可 能 会 采用 的 计算 调度 决策 算法 ， 以 及 操作 系 
统 为 了 实现 这 些 算法 所 需要 的 数据 结构 。 陷 和 机制 使 用 户 级 程序 能 够 通过 系统 调用 来 使 用 系 
统 所 提供 的 功能 (如 文件 系统 和 打印 功能 )， 以 扩展 程序 自身 的 功能 。 

在 Linux 或 者 Windows XP 等 产业 化 操作 系统 中 的 处 理 器 调度 组 件 要 比 本 书 中 所 介绍 的 复 
杂 得 多 。 本 书 的 目的 是 为 读者 提供 足够 的 视野 ， 以 便 了 解 如 何 构建 操作 系统 的 调度 子 系统 。 


14.3 ”虚拟 内 存 系 统 和 内 存 管理 


内 存 系统 对 计算 机 系统 的 性 能 起 着 至 关 重 要 的 作用 。 因 此 ， 在 本 书 中 需要 特别 注意 操作 
系统 的 内 存 管 理 组 件 与 体系 结构 对 内 存 管理 的 协助 之 间 的 相互 影响 。 为 了 支持 内 存 分 配 、 保 
护 、 隔 离 、 共 享 以 及 高 效 的 内 存 利用 等 内 存 管 理 功 能 ， 我 们 介绍 了 一 些 体系 结构 技术 ， 如 栅 


ee. 


栏 寄 人 存 筑 、 界 限 寄 存 硕 、 基 址 和 限 长 寄存 器 ， 以 及 分 页 。 我 们 也 已 经 看 到 了 操作 系统 对 于 在 
体系 结构 中 支持 特权 模式 (内核 模式 ) 的 需求 ， 以 便 在 处 理 器 进行 程序 调度 之 前 准备 好 所 需要 
的 内 存 区 域 。 我 们 讨论 了 许多 关于 操作 系统 的 问题 (如 页 面 蔡 换 策略 和 工作 集 的 维护 )， 这 些 
问题 对 于 应 用 程序 的 性 能 至 关 重 要 。 

我 们 从 处 理 器 管理 (通过 调度 算法 ) 与 内 存 管理 (通过 内 存 管理 策略 ) 中 学 习 到 的 主要 经 
验 是 操作 系统 需要 尽 可 能 快 地 做 出 决策 。 操 作 系 统 应 该 迅速 提供 程序 所 需要 的 资源 ， 然 后 迅 
ENA! 

这 些 讨论 中 的 一 个 有 趣 的 局 示 是 ， 即 使 是 最 复杂 的 内 存 管理 方案 (如 分 页 )， 以 及 非常 高 
效 的 页 面 蔡 换 算法 与 工作 集 维护 算法 ， 也 几乎 不 需要 硬件 提供 额外 的 支持 。 这 也 再 次 强调 了 
理解 系统 软件 与 硬件 之 间 的 合作 关系 的 重要 性 。 


14.4 ”分 级 存储 体系 


分 级 存储 体系 是 内 存 系统 的 重要 主题 。 程 序 的 局 部 性 (自然 会 导致 程序 的 工作 集 概念 ) 是 
让 程序 在 现代 计算 机 系统 的 大 量 内 存 中 实现 良好 性 能 的 关键 特性 。 体 系 结构 中 利用 了 局 部 性 
的 功能 是 分 级 存储 体系 。 高 速 缓存 的 概念 贯穿 于 系统 设计 的 各 个 方面 (从 Web 缓存 到 处 理 需 
缓存 )。 我 们 已 经 看 到 如 何 利 用 程序 局 部 性 在 硬件 中 为 指令 和 数据 设计 缓存 。 我 们 也 已 经 看 到 
如 何在 页 表 级 别 利用 程序 访问 的 局 部 性 设计 地 址 缓存 (TLB), 


14.5 ”并 行 系统 


并 行 是 人 类 的 基础 思想 ， 因 此 也 是 我 们 开发 算法 和 程序 的 方式 。 从 早期 计算 开始 ， 系 统 
软件 和 计算 机 设计 师 都 在 追求 并 行 性 。 随 着 集成 水 平 的 不 断 提高 ， 计 算 机 现在 可 以 容纳 多 个 
处 理 器 。 事 实 上 ， 现 在 流行 的 单 芯 片 处 理 器 都 是 多 核 的 ， 即 在 一 块 硅 芯 片上 有 多 个 处 理 套 。 

考虑 到 这 些 发 展 趋势 ， 计 算 机 科学 家 都 需要 了 解 并 行 编程 所 需要 的 系统 软件 支持 与 硬件 
协助 。 我 们 从 操作 系统 的 角度 探讨 了 一 些 主题 ， 如 在 单一 的 地 址 空间 中 文 持 多 线程 管理 ， 并 
在 这 些 线程 之 间 进 行 同步 与 数据 共享 。 我 们 也 研究 了 体系 结构 中 的 增强 功能 ， 包 括 在 顺序 处 
理 器 中 的 原子 读 出 -修改 - 写 人 原 语 ， 以 及 在 对 称 多 处 理 器 中 的 高 速 缓存 一 致 性 。 

这 个 主题 非常 丰富 ， 可 以 想象 这 是 值得 深入 探讨 的 。 项 望 我 们 已 经 激发 了 读者 进一步 探 
索 的 兴趣 。 


14.6 输入 /输出 系统 


不 能 与 外 界 进行 交互 的 计算 机 系统 实际 上 没有 什么 用 处 。 我 们 已 经 从 硬件 的 角度 看 到 了 
如 何 使 用 程控 WO 和 DMA 等 技术 将 (简单 或 复杂 的 ) 设备 接 入 计算 机 系统 。 便 件 的 中 断 机 制 
是 获取 处 理 器 注意 的 关键 。 我 们 也 已 经 看 到 内 存 映 射 VO 技术 如 何 无 缝 地 集成 VO FAS, H 
不 需要 扩充 处 理 器 的 指令 集 架 构 。 设 备 控制 器 镜像 将 设备 连接 到 处 理 器 上 ， 操 作 系统 中 称 为 
设备 驱动 程序 和 中 断 处 理 程 序 的 软件 模块 负责 操控 连接 到 系统 的 输入 /输出 设备 。 

需要 特别 关注 的 是 两 个 特殊 的 IO 子 系统 ， 即 磁盘 和 网 络 。 前 者 用 于 在 计算 机 中 进行 信 
息 的 永久 性 存储 ， 后 者 用 于 与 外 界 交 流 。 


14.7 永久 性 存储 
文件 系统 是 操作 系统 的 一 个 重要 组 成 部 分 。 毫 不 夸张 地 说 ， 它 很 可 能 是 产业 化 操作 系统 
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中 代码 行 数 最 多 的 一 个 子 系统 。 由 于 其 固有 的 简单 性 ， 对 于 任何 与 程序 进行 交互 的 输入 / 输 
出 设备 ， 文 件 都 是 一 种 方便 的 表示 形式 。 特 别 是 ， 存 储 在 磁盘 等 允许 信息 永久 保存 的 介质 上 
的 文件 可 以 超出 程序 的 生命 周期 存在 。 我 们 探讨 了 在 设计 文件 系统 时 所 做 出 的 选择 ， 包 括 文 
件 的 命名 以 及 属性 。 我 们 重点 探索 了 磁盘 这 一 介质 的 空间 分 配 策略 、 磁 盘 调度 策略 ， 以 及 在 
磁盘 上 的 文件 组 织 〈 包 括 操作 系统 中 的 数据 结构 )。 


14.8 网络 


随 着 因特网 与 万 维 网 的 出 现 与 发 展 ， 当 今 将 计算 机 系统 连接 到 外 部 世界 已 经 是 理所当然 
的 事情 。 因 此 ， 我们 投入 了 相当 多 的 时 间 分 别 从 系统 软件 与 硬件 的 角度 来 了 解 网 络 中 的 问题 。 
在 硬件 方面 ， 我 们 学 习 了 构成 当今 网 络 环境 的 网 络 设备 ， 如 网 卡 、 集 线 器 、 交 换 机 以 及 路 由 
器 。 从 系统 软件 的 角度 ,我们 理解 了 对 于 协议 栈 的 需求 ， 其 中 包括 传输 层 、 网 络 层 以 及 数据 
链 路 层 。 我 们 还 学 习 了 其 中 的 各 种 配件 ， 如 校 验 和 ， 滑 动 窗口 以 及 序号 。 例 如 ， 我 们 使 用 纠 
错 码 来 应 对 当 线 路 数据 包 出 错时 所 造成 的 数据 丢失 。 为 了 使 应 用 程序 的 有 效 载荷 能 够 符合 固 
定数 据 包 大 小 等 硬件 限制 ， 并 处 理 数据 包 的 乱 序 到 达 ， 协 议 栈 纳入 了 数据 包 的 分 散 / 收集 功 
能 。 协 议 使 用 端 到 端的 确认 来 应 对 传输 途中 的 数据 包 丢 失 。 

网 络 和 网 络 协议 是 有 待 进一步 研究 的 迷人 区 域 。 因 此 ,我们 希望 本 书 所 涵盖 的 网 络 内 容 
能 够 激 起 读者 的 兴趣 以 寻求 更 多 的 知识 。 


结束 语 


总 之 ， 系 统 体系 结构 这 一 领域 是 便 件 和 软件 之 间 的 交汇 点 ， 它 是 一 块 有 趣 且 迷人 的 区 域 。 
这 块 区 域 在 很 长 的 一 段 时 间 内 都 不 会 干 润 ， 因 为 日 党 生活 中 的 计算 应 用 正在 跨越 式 地 发 展 。 
为 了 跟 上 这 种 需求 的 增长 ， 系 统 染 构 师 需要 不 断 创 新 并 制造 新 的 计算 机 ,孜孜 不 倦 地 追求 速 
度 更 快 、 成 本 更 低 、 功 耗 更 低 ， 并 能 够 提供 更 多 服务 的 计算 机 。 我 们 希望 本 书 能 够 成 为 未 来 
的 系统 架构 师 的 起 点 。 


附录 A | 


Computer Systems: An Integrated Approach to Architecture and Operating Systems 


使 用 UNIX 套 接 字 进行 网 络 编程 





A.1 问题 描述 


使 用 UNIX 套 接 字 为 两 个 进程 (客户 端 与 服务 器 ) 编写 一 个 简单 的 客户 端 - 服务 器 通信 程 
序 。 客 户 闪 执行 在 一 台 因 特 网 名 称 是 beehive.cc.gatech.edu 的 机 器 上 ， 服 务 器 执行 在 一 台 因 特 
网 名 称 是 mit.edu 的 机 需 上 ， 服 务 需 套 接 字 所 使 用 的 端口 号 是 2999。 套 接 字 使 用 TCP/IP 作为 
通信 的 底层 协议 。 客 户 端 在 连接 完成 后 发 送 字 符 串 “Hello World! Client is Alive!”。 当 收 到 这 
条 消息 后 ,服务器 回复 字符 串 “Got it! Server is Alive!”。 客 户 端 和 服务 器 都 会 把 它们 成 功 发 
送 以 及 接收 的 消息 输出 到 标准 输出 (stdout)， 然 后 关闭 连接 并 结束 。 


A.2 源 文 件 提供 


后 面 各 节 给 出 了 客户 端 代码 、 服 务 响 代码 以 及 Makefile。 对 于 你 的 目标 机 器 ， 确 保 使 用 
正确 的 二 进 制 输出 文件 。 为 了 简单 起 见 ， 客 户 端 和 服务 器 使 用 相同 的 目标 机 器 。 例 如 ， 在 
x86 64 架构 上 编译 的 二 进 制 文件 无 法 在 1686 架构 上 运行 ， 除 非 你 使 用 了 “ -m32” 兼 容 选 项 
(尝试 使 用 “ uname -m ”来 查看 体系 结构 信息 )。 附 录 中 提供 的 Makefile 文件 使 用 “ -m32” 作 
为 默认 值 。 

如 果 你 不 了 解 示例 中 的 任何 系统 调用 ， 使 用 UNIX 帮助 文档 来 查看 详细 解释 。 如 果 你 不 
了 解 “man” 命 令 本 身 ， 那 么 输入 “man man”。 例 如， 如 果 你 想 在 任何 UNIX 机 器 上 了 解 套 
接 字 系统 调用 ， 那 么 输入 “man socket” . 


A.3 Makefile 


HEHEHE TERE TEETH ET HEE HE FHT EEE FE FHT FFE FE FHS FEE FHF FF FHF EF F FF 


## Makefile: CS2200 Client/Server Example 


# # Using UNIX Sockets 

## Author: Junsuk Shin 

## 

HEHRREEEREEEEE EEE EERE EE EEE ESTES ETRE RESTS EHH HHT HT Ht FE EF 
CFLAGS = -Wall -pedantic -m32 

LFASGS = -m32 

cc = gcc 

RM = /bin/rm -rf 

SERVER = server 

CLIENT = client 

SERVER SRC = server.c 

CLIENT SRC = client.c 

SRCS = $(SERVER_SRC) $(CLIENT_SRC) 

SERVER OBJ = $(patsubst %.c,%.0,$(SERVER_SRC) ) 


CLIENT OBJ = $(patsubst %.c,%.0,$(CLIENT_SRC) ) 
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OBJS = $(SERVER_OBJ) $(CLIENT OBJ) 


# pattern rule for object files 
Os %.¢ 
$(CC) -c $(CFLAGS) $< -o $@ 


all: $(SERVER) $(CLIENT) 


$(SERVER): $(SERVER_OBJ) 
$(CC) $(LFASGS) -o $@ $< 


$ (CLIENT): $(CLIENT_OBJ) 
$(CC) $(LFASGS) -o $@ $< 


clean: 
$(RM) $(OBJS) $(SERVER) $(CLIENT) core* 


.PHONY: depend 
depend: 
makedepend -Y -- $(CFLAGS) -- $(SRCS) 2>/dev/null 


# DO NOT DELETE 


server.o: example.h 
client.o: example.h 


A4 共用 的 头 文件 


#ifndef EXAMPLE H 
#define EXAMPLE H 


#define SERVER_PORT 2999 
#define SERVER MSG "Got it! Server is Alive!" 
#define CLIENT MSG "Hello World! Client is Alive!" 


#define MAXPENDING 5 
#define BUFF SIZE 128 


#endif 


AS 客 亡 端 源 代 码 


#include "example.h" 
#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <sys/socket.h> 
#include <netdb.h> 


const char usage[] = "Usage: client [-h] [-p <server port>] 
[-s <server address>]\n"; 


char *server_addr = NULL; 
int server_port = SERVER_PORT; 


void print_usage(void) { 
printf("%s",usage); 
exit(EXIT FAILURE) ; 
} 


void read options(int argc, char *argv[]) { 


488 


int c: 


/* read command line options */ 
while ( (c=getopt(argc,argv,"hp:s:")) != -1 ) { 


switch(c) { 
case 'p': 
server port = atoi(optarg) ; 
if ( server_port <= 0 ) { 
print _usage(); 
} 
break; 
case 's': 
server addr = optarg; 


break; 
case "N's 
default: 
print _usage(); 
} 
} 
if ( server_addr == NULL ) { 
print_usage(); 
} 


} 


int connect _to(char *host, int port) { 
int sock; 
struct addrinfo hint; 
struct addrinfo *addr; 
char port _str[8]; 


/* 


+ + + + * 


making connection from a client side is simpler than 
a server side 
It follows 2 steps: 

1) make socket (socket) 

2) make connection (connect) 


*/ 
memset(&hint, 0, sizeof(hint)); 
hint.ai_family = PF_INET; 
hint.ai_socktype = SOCK _STREAM; 
snprintf(port_str,8,"%d",port); 


/* First, need to find out network address with a given 
* host name. host can be any form such as 
* host name — tokyo.cc.gatech.edu or 
* dotted decimal notation — 192.168.1.1. 
* When a descriptive name is needed, gethostbyname() 
* or gethostbyname r() can be used. The behavior of 
* gethostbyname() when it is passed a numeric address 
* string as a parameter is unspecified. 
* For the dotted decimal notation, 
* inet_addr() can be used. 
* Since the return value from the above two 
* system calls (gethostbyname and inet addr) are 
* different, the return value 
* should be handled differently. 
* In this example, getaddrinfo() is used, and it 
* simply handles both cases. 
* / 
/* The getaddrinfo() function shall translate the name 
* of a service location (for example, a host name) 
* and/or a service name and shall return 
* a set of socket addresses and associated information 
* to be used in creating a socket with which to 
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* address the specified service. 
* 
getaddrinfo(host, port str, &hint, &addr); 


/* Second, make socket 
* (use addrinfo set by getaddrinfo() ) 
* It can be simply 
* socket (PF INET, SOCK STREAM, IPPROTO TCP) for a 
* tcp/ip connection. 
*/ 
if((sock = socket(addr—ai_family, 
addr 一 ai_socktype, 
addr—ai_protocol)) == -1) { 
perror ("socket"); 
return -1; 


/* Third, connect to a socket 
Since, getaddrinfo() sets the relevant fields of 
addr variable, we can simply use them for this call. 
For example, if gethostbyname() is used to resolve 
the network address, you might code the connect 
* call differently. 
*/ 
if (connect(sock, 
addr — ai addr, 
addr 一 al addrlen) == -1 ) { 
perror ("connect"); 
return -1; 


+ + + 水 


free(addr); 


return sock; 


} 

int main(int argc, char *argv[]) { 
int socket; 
int sent_size, recv_size; 


char buffer[BUFF_ SIZE]; 
read options(argc,argv) ; 


socket = connect_to(server_ addr, server port); 
if ( socket <= 0 ) { 

return EXIT FAILURE; 
} 


/* send a message on a socket */ 
/* Usually, recv/send doesn't fail, but always need to 
* check (good programming habit!). 
* / 
sent size = send(socket, 
CLIENT MSG, 
strlen(CLIENT MSG)+1,0); 


if ( sent_size == =1 ) { 
perror ("send"); 
exit(EXIT_FAILURE); 
} 
printf ("Message sent to %s\n\t%s\n", 
server addr,CLIENT MSG); 


/* Receive a message from a connected socket */ 
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buffer for the message needs to be provided. 

It returns the length of the message written to 

the buffer unless there is an error. 

By default, it's blocking call. If interested, 

check out fcntl(), O _NONBLOCK, and EAGAIN return 
* value. 


e+ SS @h SF F 


*/ 
recv size = recv(socket,buffer,BUFF SIZE,0); 
if ( recv size == -1 ) { 


perror("recv"); 
exit(EXIT FAILURE) ; 
} 
printf("Message received from %s\n\t%s\n", 
server addr,buffer) ; 


/* Close sockets */ 


Not really necessary, since the program terminates, 


but it's a good habit. 
Same for file descriptors and 


sockets. Also, there's a limit for such 
descriptors that a user can open. Simply, 
you cannot 

* open file/make socket beyond the limit. 

* / 
close(socket) ; 
return EXIT SUCCESS; 


+ + + +*+ F & 


A.6 服务 器 源 代码 


#include <unistd.h> 
#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <sys/types.h> 
#include <sys/socket.h> 
#include <arpa/inet.h> 
#include “example.h" 


union sock { 


struct sockaddr s; 
struct sockaddr in i; 


const char usage[] = 


"Usage: server [-h] [-p <port number>]\n"; 


int port = SERVER_PORT; 
char client _ip[16]; 


void print_usage(void) { 


} 


printf("%s",usage) ; 
exit(EXIT_ FAILURE) ; 


void get_options(int argc, char *argv[]) { 


int Cz 


/* read command line options */ 
/* “hp:" means -h and -p <string> */ 
while ( (c=getopt(argc,argv,"hp:")) != -1 ) { 
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switch(c) { 
case 'p': 
port = atoi(optarg); 
if ( port <= 0 ) { 
print _usage(); 
} 
break; 
case 'h': 
default: 
print _usage(); 


} 

int create server _socket(int port) { 
struct sockaddr in serv_addr; 
int serv_sock; 


int opt = 1; 


/* Creation of server socket usually follows these 3 


* steps: 

* 1) make socket / create endpoint of 

* communication, 

* 2) bind a name (address) to a socket, and 
* 3) listen for incoming socket connections. 
*/ 


memset(&serv_addr, 0, sizeof(serv addr)); 
serv_addr.sin family = PF_INET; 
serv_addr.sin_addr.s_ addr = htonl(INADDR_ANY); 
serv_addr.sin_port = htons (port); 


/* make TCP socket */ 
/* PF _INET : IP protocol family 
For more options, check out 


* /usr/include/bits/socket.h 
* (e.g., PF UNIX for unix domain socket) 
* SOCK STREAM : sequenced, reliable connection 

R (e.g., SOCK DGRAM for connectionless, 

* unreliable connection) 

* IPPROTO TCP : Transmission Control Protocol/TCP 

* (e.g., IPPROTO UDP, IPPROTO RSVP, etc.) 
* check out /usr/include/netinet/in.h 
* /usr/include/linux/in.h 

* / 


if ((serv_sock=socket(PF_INET, 
SOCK_STREAM, 
IPPROTO TCP)) == -1 ) { 


perror ("socket"); 
return -1; 


/* Set port as reusable */ 


* Port may not be usable if it's not closed properly 

* (e.g., segfault, kill process) Specifies that the 

* rules used in validating addresses supplied to 

* bind() should allow reuse of local addresses. 

* / 

if (setsockopt(serv_sock, 
SOL SOCKET, 
SO _REUSEADDR, 
&opt, 
sizeof (opt)) == -1 ) 
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perror("setsockopt") ; 
return -1; 


} 

/* Bind a name (server_addr) to a socket (serv_sock). 
* When a socket is created with socket(), it exists in 
* a name space (address family), but has no name 
* assigned. 

* 

* It normally is necessary to assign a 

* local address by 

* using bind before a SOCK STREAM socket may receive 
* connections (accept()). 

* / 


if (bind(serv_sock, 
(struct sockaddr *)&serv_addr, 
sizeof(serv_addr)) == -1 ) { 
perror("bind"); 
return -l; j 


/* 
* Listen for socket connections and limit the queue of 
* incoming. 
*/ 
if (listen(serv_sock,MAXPENDING) == -1 ) { 
perror ("listen"); 
return -1; 


return serv_sock; 


void read client_ip(int sock) { 
union sock client; 
int client_len; 


client_len = sizeof(struct sockaddr); 
/* get the name of the peer socket */ 
getpeername (sock, 

&(client.s), 

(socklen_t *)&client_len); 


/* inet ntoa() convert the Internet host address to a 
* string in the Internet standard dot notation. 
*/ 
strncpy(client_ip,inet_ntoa(client.i.sin_addr),16); 


} 

int main(int argc, char *argv[]) { 
int server sock, client_sock; 
int recv_size,sent_size; 
struct sockaddr in c_addr; 
unsigned int c_len = sizeof(c_addr); 
char buffer[BUFF_ SIZE]; 


get_options(argc,argv); 
server sock = create_server_socket(port); 
/* Waiting on a client connection */ 


/* 


t A UNIX #42 1477 MBSR FE 493 


The accept function is used with connection- 
based socket types: 

(SOCK_STREAM, SOCK _SEQPACKET and SOCK RDM). 
It extracts the first connection request on the 
queue of pending connections, creates a new 
connected socket with mostly the same properties as 
s, and allocates a new file descriptor for the 

* socket, which is returned. 

*/ 
if ( (client_sock=accept(server sock, 
(struct sockaddr *)&c addr, 
&c_len)) == -1 ) 1 
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perror ("accept"); 
return EXIT_FAILURE; 


read client_ip(client_sock); 


/* Receive a message from a connected socket */ 


/* 
* Buffer for the message needs to be provided. 
* It returns the length of the message written to 
* the buffer unless there is an error. 
* By default, it's blocking call. If interested, 
* check out fcntl(), O_NONBLOCK, and EAGAIN return 
* value. 
*/ 
recv size = recv(client_sock,buffer,BUFF_SIZE,0); 
if ( recv size == -1 ) 1 
perror("recv"); 
exit(EXIT FAILURE) ; 
} 


printf("Message received from %s\n\t%s\n", 
client _ip,buffer); 


/* Send a message on a socket */ 
/* Usually, recv/send doesn't fail, but always need 
* to check (good programming habit!). 
* / 
sent_size = send(client_sock, 
SERVER_MSG, 
strlen(SERVER_MSG)+1, 0); 
if ( sent_size == -l } { 
perror("send"); 
exit (EXIT_FAILURE) ; 
} 
printf("Message sent to %s\n\t%s\n", 
client _ip,SERVER_MSG) ; 


/* Close sockets */ 


Not really necessary, since the program terminates, 
but it's good habit. Same for file descriptors and 
sockets. Also, there's a limit for such 
descriptors that a user can open. Simply, 

you cannot 

* open file/make socket beyond the limit. 

* / 
close(client_sock) ; 
close(server_sock); 


+ + + + & 站 
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return EXIT SUCCESS; 
} 


A.7 Ain- ARS ete UTA 


示例 程序 在 服务 器 端 使 用 以 下 默认 端口 : 

。 MRS ag; 2999 

这 个 选项 可 以 通过 命令 行 参 数 改变 。 

为 了 执行 该 程序 ， 你 需要 运行 客户 端 程序 和 服务 器 程序 : 
。 Aka at 

运行 服务 器 程序 (如 果 需 要 ， 可 以 使 用 不 同 的 参数 ) 
例如 


./server (使 用 默认 选项 运行 ) 
./server -p 3333 (将 服务 器 的 端口 号 设置 为 3333 ) 


。 客户 端 
运行 客户 端 程序 (如 果 需 要 ， 可 以 使 用 不 同 的 参数 ) 
例如 


./client -s < host ip | host name > 
./client -p 3333 -s helsinki.cc.gatech.edu. 
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498, 634 
Applications, launching of (WJH, Jaz), 10-11 
Arbitrary message size (任意 消息 大 小 )，627 
Arbitration logic (仲裁 逻辑 )，670 
Architectural enhancements, program 
discontinuities and (体系 结构 增强 ， 程 序 不 连 
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续 性 )，135-143 

Architecture styles (体系 结构 风格 )，59 

Arithmetic logic unit (ALU) (算术 逻辑 单元 )，22， 
79, 175 

Arithmetic mean (AM )( $7 FIZ), 162-163, 170 

ARM architecture (ARM 体系 结构 )，123 

Arrays (tH), 35-37 

Arrival time, process (到 达 时 间 ， 进 程 )，247 

ASCII format (ASCII 人 码 格 式 )，424 

Association for Computer Machinery (ACM), 16 

Associative memory (相关 存储 器 )，345 

Asynchronous events (异步 事件 )，130-131 

Asynchronous logic circuits (异步 逻辑 电路 )，91 

Asynchronous mode transfer ( ATM) (异步 模式 传 
输 )，678 

Asynchronously produced data (异步 生成 数据 )，428 

Athlon, AMD processor ( Athlon, AMD 4b ## #5), 
210, 222 

Atomic instruction (原子 指令 )，142 

Atomic test-and-set instruction (原子 的 Test-and-Set 
指令 )，575-577 

Atomicity (原子 性 )，268，543-544，582 

Attachment unit interface (AUI) cable (连接 单元 接 
口 电缆 )，713 

Attenuation, electrical signals and (电信 号 衰减 )， 
079 

Audio data rates (音频 数据 传输 速率 )，439 

Autoincrement (自动 递增 模式 )，111 

Autonomous system (AS) ( 目 治 系统 )，657，659 

Average rotational latency (平均 旋转 延迟 )，446 

Average seek time (平均 寻 道 时 间 ), 446 

Average turnaround time (平均 周转 时 间 )，245 

Average waiting time (平均 等 待 时 间 )，245，452 
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Babbage, Charles, 16, 273 
Back end, microarchitecture (后 端 ， 微 体系 结构 )， 
223-224 
Backplanes (774%), 77 
Backus, John, 16 
Backward compatability (ln) JAFEZ), 66 
Bandwidth ( #7 宽 ), 393, 429, 431, 461-462, 
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465, 604, 640, 644-645, 650, 653, 663- 
664, 676, 678, 690 
Barcelona, AMD processor ( Barcelona, AMD 处 理 
ft), 419, 611 
Bardeen, John, 12 
Barrier synchronization (障碍 同步 )，539 
Base and limit registers, memory management And 
( 基 址 + 限 长 寄存 器 ， 内 存 管理 )，284，285 
Base band signaling technique (基带 信号 技术 )，673 
Base+offset addressing mode ( 基 址 + 偏 移 量 寻 址 模 
K), 27, 35-37 
Basic blocks (基本 块 )，214-215 
Basic computer organization (基本 的 电脑 组 成 )，22 
Basic input/output system (BIOS) (基本 输入 /输出 
AG), 464, 503-504 
Batch-oriented operating systems ( 批 处 理 操作 系 
%.), 13, 273 
Bayonet Neill-Concelman (BNC), 714-715 
Belady, Laszlo, 327 
Belady’s Min algorithm (Belady 的 Min 4%), 326-327 
Bell Laboratories (贝尔 实验 室 )，12 
Benchmarks (基准 测试 程序 )，161-165 
BEQ instruction (BEQ 指令 )，112-116，187 
Berkeley RISC, 74, 123, 232 
Best fit (最 佳 适应 )，289 
Big endian (Acid), 31-32 
Binary instructions〈 双 操作 数 指令 )，22 
Binary semaphore (二 元 信号 量 )，576-577 
Blackberry mobile phones (黑莓 手机 )，17 
Blackberry OS (age (FAS), 13, 17 
Block multiplexer channel (阻塞 多 路 复 用 信道 )，434 
Block-offset( 块 偏 移 量 )，378 
Block-oriented devices (面向 块 的 设备 )，438-440 
Block size( 块 大 小 ) 
cache organization and (缓存 组 织 结构 )，369，378 
miss rate behavior and (缺失 率 行 为 )，383 
multiword (4), 379-381 
performance implications of (性 能 影响 )，383-384 
Blocked state (阻塞 状态 )，535 
Blue Gene, IBM, 226, 601, 604 
Bolt Beranak and Newman ( BBN ), 604, 613, 
618, 712, 718 
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Boolean logic functions (布尔 逻辑 图 数 )，119-120 
Boot block, file system (启动 块 ， 文 件 系 统 )，506 
Booting up (开启 )，464 
Bootstrapping (引导 程序 )，464 
Border gateway protocol (BGP) (边界 网 关 协 议 )， 
657 
Bottom-half handlers , Linux (Bottom-half 处 理 过 程 ， 
Linux)，154 
Bounds registers, memory management and (界限 
寄存 器 ， 内 存 管理 )，282-284 
Branch handling techniques (分 支 处 理 技 术 )，200- 
211 l 
Branch instruction (分 支 指令 )，38-39 
Branch prediction (分 支 预测 )，205-208，210 
Branch target buffer (分 文 目 标 缓存 )，208 
Brattain, Walter H., 12, 15 
Bridges, networking hardware (网 桥 ， 网 络 人 硬件 )， 
679-681 
Bubble in pipeline (流水 线 中 被 引入 的 气泡 )，187 
Bubbles，RAW data hazards and (气泡 ， 写 后 读数 
据 冒 险 )，196，199 
Buffering (缓冲 )，178 
Burroughs Corporation (Burroughs 公司 )，310 
Burst time, CPU (RÆKJ, CPU), 252 
Bus arbitration (总 线 仲裁 )，670 
Bus-based design (基于 总 线 的 设计 ) 
single bus design ( 单 总 线 设计 )，86-87 
two bus design ( 双 总 线 设 计 )，87-89 
Buses (总 线 ) 
bus arbitration (总 线 仲 裁 )，432 
bus clock line (总 线 时 钟 线 )，433 
bus to match cache block size (与 缓存 块 大 小 相 
匹配 的 总 线 )，406 
cycle time and (时 钟 周期 )，393 
IO bus evolution (IO 总 线 的 发 展 )，461-463 
master-slave relationship and ( 主 从 关系 )，433 
peripheral component interchange ( PCI) 
and(〈 外 围 组 件 互 连 )，432 
split transaction (分 离 传 输 )，433 
standard bus and system bus coexistence (标准 总 
线 与 系统 总 线 共 人 存 )，432-433 
Busy waiting, thread synchronization and (È 等待， 


线程 同步 )，548，560 
Byte offset, caches and (i (mit, 2246), 367 


C 
C-LOOK algorithm, disk scheduling and ( C-LOOK 
算法 ， 磁 盘 调 度 )，455-457 
C programming language (C 语言 )，28-29 
C-scan (circular scan), disk scheduling and (C 扫描 
(循环 扫描 )， 磁 盘 调 度 )，455 
Cable modem ( H Ai vel iil val at), 622 
Caches. See also Memory hierarchy (24247, BULA 
级 存储 体系 ) 
cache blocks (缓存 块 )，366，388 
cache coherent multiprocessors (缓存 一 致 的 多 处 
FE ar), 604 
cache line (FÍT), 366-369 
cache lookup (2247 #F4K), 363-365 
cache memories (缓存 )，158 
concept of (H), 354-355 
controller (Eml), 400 
data-caches (D-cache) (数据 缓存 ,， D 缓存 )， 
392-393 
directory-based schemes and (基于 目录 的 方案 )， 
605 
entry fields (缓存 项 的 字段 )，365 
fully associative (全 相关 )，385-387 
indices (51), 363, 365-366 
instruction caches (I-cache) (指令 缓存 ,I 缓存 )， 
392 
integrating TLB and (TLB 整合 )，399-400 
main memory organization and block size ( 主 存 
结构 与 块 大 小 )，406 
memory consistency models and (内 存 一 致 性 模 
型 )，607-610 
memory location copy in (拷贝 内 存 内 容 )，180 
memory stalls and (内 存 延 迟 )，376-377 
misses in processor pipeline (处 理 器 流水 线 的 缺 
失 )，375-377 
organization and (组 织 )，360-369 
performance, spatial locality to improve (提升 性 
能 、 空 间 局 部 性 )，377-384 
read access to cache from CPU ( CPU 对 缓存 的 
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读 访 问 )，370 
read/write algorithms ( 读 / 写 算 法 )，370-375 
replacement policy and (替换 策略 )，394-396 
set associative (组 相关 )，387 
snoopy caches ( 侦 听 缓存 )，580-581 
virtually indexed physically tagged (虚拟 索引 物 
理 标 记 的 )，401-402 
virtually tagged (虚拟 标记 的 )，403 
write access to cache from CPU ( CPU 对 缓存 的 
写 访 问 )，370-375 
write miss in MEM stage (在 MEM 阶段 没有 写 
命中 )，375-376 
Cactus stack (AAF), 567 
Call/return procedure (过 程 调用 /返回 )，48-53 
Call teardown (呼叫 拆除 )，667 
Callee (被 调用 者 )，42，46-47 
Caller (调用 者 )，42 
Capacity misses (容量 缺失 )，385，396-397 
Carrier sense multiple access/collision detect ( CSMA/ 
CD)( 载 波 监听 多 路 访问 / 冲突 检测 )，671-673 
Cascaded interrupts〈 级 联 中 断 )，138-141 
Cathode-ray-terminal ( CRT) -based display Devices 
(基于 CRT 的 显示 设备 )，710 
CD-R, 508-509 
CD-ROM, 508-509 
CD-RW, 439-440 
CDC 6600, 219 
Cell, DRAM storage (430, DRAM 存储 )，408 
Cell processor (Cell 处 理 器 )，68 
Central processing unit (CPU )( 中 央 处 理 单元 ) 
bursts ( 突 发 )，242-243 ，260-261 
burst time (〈 突 发 时 间 )，252 
cache lookup and (缓存 查找 )，363-365 
communication with I/O devices (与 IO 设备 通 
信 )，423-427 
datapath design and (数据 通路 设计 )，91 
handling write-miss and (处 理 写 缺失 )，380 
interpreting CPU-generated address ( 解 释 CPU 
生成 的 地 址 )，306-307 
main memory connection to 〈 主 存 连接 到 )，393 
memory access path and (内 存 访 问 路 径 )，400 
memory address generation and (内 存 地 址 生成 )， 
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378-379 
multiword direct-mapped cache organization 
and (多 字 直 接 映 射 缓存 组 织 结构 )，379-380 
power consumption and ( 功 耗 )，221-222 
read access to cache from (对 绥 存 的 读 访 问 )，370 
scheduling and system performance (调度 和 系统 
TERE), 416 
simple main memory and (简单 的 主 存 )，405 
time quantum and (时 间 量 子 )，416 
utilization and (利用 率 )，245 
write access to cache from (对 缓存 的 写 操 作 )， 
370-375 
Cerf, Vinton, 712 
Channels (信道 )，434 
Character-oriented devices (面向 字符 的 设备 )， 
438-440 
Checksum ( 校 验 和 )，685 
chgrp, UNIX command ( chgrp，UNIX 命令 )，473， 
475 
Chip multiprocessors (芯片 多 处 理 器 )，221-222 
chmod, UNIX command ( chmod, UNIX MA), 473, 
475, 518 
Circuit switching (HAPRACHR), 663-664, 667, 669 
Circuits, combinational and sequential logic 
and (电路 ， 组 合 和 时 序 逻 辑 )，78 
Circular wait (循环 等 待 )，583-584 
Clean and dirty page distinction (干净 页 和 脏 页 的 区 
St), 320 
Clear to send (CTS) ( RIF RIE), 674 
Client (客户 端 )，3 
Clock algorithm (时 钟 算 法 )，335 
Clock cycle (时钟 周期 )，81，84-86 
Clock cycle times (时 钟 周 期 时 间 )，159，165， 
216, 217 
Clock pulse width (时 钟 脉冲 宽度 )，94 
Clock signal, register and (时 钟 信号 ， 寄 存 器 )，80 
Clocks per instruction(CPI)( 每 指令 的 时 钟 周期 数 )， 
159, 166, 186 
Cloud computing ( 云 计 算 ) ,14, 255 
Cluster parallel machine (集群 并 行 机 器 )，604 
Clusters (F), 226, 517, 615 
CMOS, 12, 123, 465 
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Co-routines (HE), 569 

Coarse-grain critical sections ( 粗 粒度 临界 区 )，544 

Coarse-grained parallelism ( 粗 粒 度 并 行 度 )，603 

Coaxial cable ( 同 轴 电缆 )，630，713-714 

Cocke, John, 158 

Code fragment for thread creation (线程 创建 的 代码 
Fr Bx), 526 

Code refinement (代码 优化 ) 

with coarse-grain critical sections (#4 i FE li Ft 
IX), 544 
with fine-grain critical sections( 细 粒度 临界 区 ), 
545-546 

Code with no synchronization (无 同步 的 代码 )， 
541-543 

Cold misses ( 冷 缺 失 )，396 

Collision avoidance (冲突 避免 )，674 

Collision detection ( 冲突 检测 )，672 

Collision domain (PREX), 672, 679-680 

Column access strobe (CAS), DRAM and ( 列 访问 
iti fa, DRAM), 409-410 

Combinational logic, circuits and (组 合 逻辑 ， 电 
路 )，78 

Combinational logic delays (组 合 逻 辑 延 迟 )，180 

Commit (提交 )，514 

Common data bus(CDB) (公共 数据 总 线 )，220 

Communication among threads (通过 线程 通信 )， 
$26-527 

Communication deadlocks (通信 死 锁 )，586 

Compaction (4#Ff), 289-290 

Complete interrupt handler (完整 的 中 断 处 理 过 程 )， 
142 

Completed execution, microarchitecture and (执行 
完毕 ， 微 体系 结构 )，218 

Completion order, microarchitecture and ( 完 
微 体系 结构 )，217-218 

Complex instruction set computers (CISC) (复杂 指 
SEAL), 66, 123, 157 

Compulsory miss (9R GRA), 385, 396-397, 462 

Compute bound workload (计算 受 限 的 负载 )，266 

Computer hardware evolution (计算 机 人 硬件 的 演化 )， 
11-12 

Computer peripherals, data rates of ( 计算 机 外 围 设 


顺序 ， 


备 ， 数 据 传输 速率 )，439 
Computer systems (计算 机 系统 ) 
abstraction levels of (抽象 层次 )，2-5 
application launching and (启动 应 用 程序 )，10-11 
hardware organization and (硬件 组 织 )，8-10，9f 
I/O and system bus and (IO 和 系统 总 线 )，11 
instantiations of (实现 形式 )，8，8f 
Concurrency (并 发 )，554-555 
Concurrency problems (并 发 问题 )，592-596 
Concurrent processes, sharing of memory by (并 发 
进程 ， 共 享 内 存 )，280 
Condition variable data type (条 件 变量 数据 类 型 )， 
551-552 
Condition variables (条 件 变 量 )，548-552，586 
Conditional branch engineering in microprogram (ix 
计 微 程序 中 的 条 件 分 支 )，116-117 
Conditional statements and loops 
as high-level language feature (高 级 语言 功能 集 
中 的 条 件 语句 和 循环 )，21 
if-then-else statements (if-then-else 语句 )，38-40 
loop statements (循环 语句 )，41-42 
switch statements (switch 语句 )，40-41 
Conflict miss (冲突 缺失 )，363，396-397 
Content addressable memory (CAM) (内 容 寻 址 存 
储 器 )，345 
Context switching (E FX), 259, 268, 316 
Contiguous allocation (连续 分 配 )，477-480 
Contiguous words (连续 的 字 )，378 
Control pipeline hazards (控制 流水 线 冒 险 ) 
branch prediction and (分 支 预 测 )，205-208 
branch prediction with branch target buffer (#74 
文 目 标 缓存 的 分 文 预测 )，208 
delayed branch and ( HEIR 4}3¢ ), 203-205 
handling branches and (处 理 分 支 )，200-203 
Control program monitor (控制 程序 监控 器 )，274 
Control signal table (控制 信号 表 )，97 
Control unit design (控制 单元 设计 )，95-96 
Convoy effect (护送 效应 )，247，249 
Core memory (CW Mitr), 122 
Counting semaphore (计数 信号 量 )，577 
CPU brust time (CPU 突 发 时 间 )，252，255 
Cray, Seymour, 226 
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Cray computer (Cray 计算 机 )，465，613 

Cray series (Cray 系列 )，226 

Creation time, file system attributes and (创建 时 间 ， 
文件 系统 属性 )，471，474 

Critical section (临界 区 )，536-537，560 

Cycle count (时 钟 周期 数 )，159 

Cycle stealing (AIHH), 431 

Cycle time (时 钟 周 期 时 间 ), 353 


D 
D-MEM, 176, 179 
Daemon processes (守护 进程 )，278 
Daisy chaining (菊花 链 )，144-145 
DARPA ( Defense Advanced Research Projects 
Agency)( 美 国 国防 部 先进 研究 项 目 局 )，226 
Data (数据 ) 
caches (缓存 )，392-393 
direct memory access(DMA )and( 直接 内 存 访问 )， 
429-43] 
directory files and (目录 文件 )，507 
forwarding (转发 )，192-197 
high-level abstractions and (高 级 抽象 )，21 
overrun flag (溢出 标志 位 )，425 
precision (精确 度 )，28 
race (£f), 528, 560 
register (A 4F At), 424 
storage management and (存储 管理 )，506-507 
threads library and (EJE ), 540-541 
transfer time (传输 时 间 )，444-445 
Data Hazards (数据 冒险 ) 
read after write hazard ( 写 后 读 冒 险 )，187，190-199 
write after read hazard ( 读 后 写 冒 险 )，189-190， 
199-200 
write after write hazard ( 写 后 写 冒 险 )，189-190， 
199-200 
Dataflow architectures (数据 流体 系 结构 )，122-123 
Datagram (数据 报 )，667，669，705 
Datapath (数据 通路 ) 
design (设计 )，91-93 
element connections (元 件 连 接 )，82-86 
enhancements for handling interrupts (4b 3E HP Wr 
的 增强 )，143-146 
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instruction pipeline and (指令 流水 线 )，178-180 
instruction-set architecture and (指令 集体 系 结 
构 )，93-94 
organization leading to lower CPI ( 减 小 CPI 的 
组 织 )，166 
processor (处 理 毅 )，79 
Daughter cards ( 子 卡 )，463 
DBUF buffer, pipeline register (DBUF 缓存 ， 流 水 
线 寄存 器 )，182-183 
Deadline scheduling (截止 时 间 调 度 )，269 
Deadlocks (FE fii) 
absence of (Z ), 555-556 
avoidance (避免 )，584 
concept of (概念 )，583-586 
definition of (定义 )，560 
detection (W), 584-585 
multithreaded programming and (多 线程 编程 )， 
546-548 
prevention (预防 )，584 
Debugging, processor design and (调试 ， 处 理 器 设 
计 )，69 
DEC Alpha architecture ( DEC Alpha 体系 结构 )， 
31, 58, 123 
DEC VAX architecture (DEC VAX 体系 结构 )，58 
DECODE macro state ( DECODE #4K45), 91, 102- 
103, 116-119 
Decode units (解码 单元 )，215 
Deep pipelining (RK), 216-218 
Degree of associatively (相关 程度 )，387 
Degree of multiprogramming (多 道 程序 度 )，241 
Delay slot (延迟 槽 )，203-205 
Delayed branch (延迟 分 支 )，203-205，210 
Delays, packet-switched networks and (延迟 ， 分 
组 交换 网 络 )，669 
Dell, 61, 461 
Demand paging ( 按 需 分 页 ) 
data structures for (数据 结构 )，318-319 
disk map and (磁盘 映射 ); 319 
frame table and (页 帧 表 )，319 
free-list of page frames and (空闲 页 帧 表 )，318-319 
hardware for (硬件 )，317-318 
hardware for instruction restart (为 指令 重启 的 
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硬件 )，318 
page fault anatomy (页 错误 解析 )，320-324 
page fault handler and (页 错误 处 理 程序 )，318 
page table entry and (页 表 项 )，317 
processor pipeline and (处 理 右 流水 线 )，317 
Desktop computers ( 果 面 计算 机 )，266 
Destination port ( 目标 端口 )，687 
Device drivers (设备 驱动 ) 
characteristics of (特征 )，434-438 
dynamic loading of (动态 负载 )，463 
evolution of (演化 )，461-464 
file systems and (文件 系统 )，499 
Difference engine (差分 机 )，16 
Digital Equipment Corporation (DEC), 66 
Digitizer thread, data structure and (数字 化 部 件 
线程 ， 数 据 结构 )，527 
Dijkstra, Edsger, 576-577 
Dijkstra’s link state routing algorithm ( Dijkstra 链 路 
状态 路 由 算法 )，653-655 
Dining philosophers, classic concurrency Problems 
(哲学 家 就 餐 ， 著名 同步 问题 )，593，595- 
597, 617 
Direct access, ISA and (直接 访问 ，ISA)，358 
Direct-mapped cache organization (直接 映射 缓存 结 
构 )，360-369 
cache entry fields (缓存 项 中 的 字段 )，365 
cache lookup〈 绥 存 查找 )，363-365 
hardware for direct-mapped cache (直接 映射 组 
存 的 硬件 )，366-369 
with write-back policy ( 回 写 策略 )，373-374 
Direct memory access (DMA) (直接 内 存 访 问 )， 
429-43] 
Directory-based schemes (基于 目录 的 方案 )，581， 
605 | 
Dirty bit, caches and (HE{iz, FF), 373 
Discontinuities in program execution (程序 执行 中 
的 不 连续 性 )，130-132 
Disk block address〈 磁 盘 块 地 址 )，477 


Disk conceptual layout (磁盘 的 概念 性 布局 )，505 


Disk drive (人 磁盘 驱动 )，449 
Disk map (磁盘 映射 )，319-320 
Disk recording (磁盘 记录 )，450 
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Disk request queue (磁盘 请 求 队列 )，451 
Disk scheduling algorithms (磁盘 调度 算法 ) 
algorithm comparison (算法 比较 )，458-459 
C-scan (circular scan) (循环 扫描 )，455 
disk request queue and (磁盘 请 求 队列 )，451 
first-come first-served ( 先 到 先 服务 )，453 
LOOK and C-LOOK, 455-457 
performance metrics and (性 能 度量 )，452 
SCAN (elevator algorithm) (电梯 算法 )，453-455 
shortest seek time first (最 短 寻 道 时 间 优 先 )，453 
Disk storage (磁盘 存储 )，440-451 
Disk technology saga (磁盘 技术 的 传奇 故事 )，448-451 
Disk transfer latency (磁盘 传输 延迟 )，451 
Dispatch (分 发 )，243 
Dispatcher (44), 241, 263 
Distance vector algorithm (距离 癌 量 算法 )，656-657 
Distributed-shared memory ( DSM) (分 布 式 共 享 内 
存 )，604 
Dotted decimal notation (点 分 十 进 制 )，660 
Drivers, buses and (驱动 器 ， 总 线 )，87 
DSP ( digital signal processing) applications (数字 
信号 处 理应 用 )，124 
Dual in-line memory modules (DIMM)( 双 列 直 插 式 
存储 模块 )，412-414 
Dual-ported register file (DPRF )( 双 端口 寄存 器 堆 )， 
176-177，179 
Dumb terminals (MA sit), 462 
Duplicate stack pointer (复制 栈 指 针 )，147-148 
DVD-R data rates (DVD-R 数据 传输 速率 )，439- 
440 
Dynamic address translation (动态 地 址 转换 ) ,310 
Dynamic instruction frequency (动态 指令 频率 )， 
160-161, 170 
Dynamic memory allocation (动态 内 存 分 配 )，68 
Dynamic random access memory (DRAM) (动态 随 
机 访问 存储 ) 
1 G-bit DRAM chip (1 G-bit DRAM 芯片 )，411， 
413 
cache block size and (缓存 块 尺 寸 )，406 
dual in-line memory modules and (XLF HIIRI 
储 模块 )，412 
interleaved memory and (交错 式 内 存 )，407-408 
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modern memory systems and (现代 内 存 系统 )， 
408-415 
page mode DRAM (页 式 DRAM), 412-415 
simple memory system and (简单 内 存 系统 )，405 
Dynamic relocation, memory management And (Z) 
态 重 定 位 ， 内 存 管理 )，284-285 


E 
EBUF buffer, pipeline register (EBUF mK, yi 
水 线 寄 存 器 )，182-183 
Eckert, J. Presper, 15, 273 
Edge-triggered logic (边沿 触发 逻辑 )，79-82 
Effective memory access time (EMAT)( 有 效 内 存 访 
问 时 间 )，356 
Electronically erasable programmable readonly 
memory (EEPROM) ( 电 可 擦 可 编程 只 读 存储 
fit), 460 
Embedded computing (# Astit® ), 266, 270 
Endianness (73 FF), 30-32 
Engineering a conditional branch in 
microprogram (设计 微 程序 中 的 条 件 分 支 )，116-117 
ENIAC (Electronic Numerical Integrator and 
Computer)( 电 子 数字 积分 计算 机 )，11，11f 
Enterprise computing (企业 计算 )，266 
Error correcting codes (ECC)( 244"), 648 
Ethernet (以 太 网 ) 
evolution of (历史 回顾 )，713-715 
fast (快速 )，714-715 
invention of (发 明 )，713 
protocol (协议 )，670-671 
EX stage, pipelining (EX 阶段 ， 流 水 线 )，177-180 
Exception/trap register ( ETR) (异常 / 陷 人 寄存 器 )， 
134，149 
Exceptions (异常 )，131-132. See also Program discon- 
tinuities (也 参见 “程序 的 不 连续 性 ”) 
Execution models (执行 模型 )，533 
EXECUTE macro state (EXECUTE 宏 状 态 ) 
ADD instruction (ADD 指令 )，103-106 
BEQ instruction (BEQ 指令 )，112-116 
JALR instruction (JALR 指令 )，106-108 
LW instruction (LW 指令 )，108-111 
NAND instruction (NAND 指令 )，106 
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SW and ADDI instructions (SW 和 ADDI 指令 )，111 
Executed instructions, reduction of (执行 的 指 今 ， 
减少 )，166 
Execution core (执行 核心 )，223-224 
Execution model for parallel program (并 行程 序 的 
执行 模型 )，560 
Execution time (执行 时 间 )，157，159，170，174-175 
Expected I/O requirements (期 望 IO 需求 )，238 
Expected memory usage (期 望 内 存 使 用 )，238 
Expected running time (期 望 运行 时 间 )，238 
Exponential backoff (42GB st), 672 
Expressions and assignment statements (表达 式 和 赋 
值 语句 ) 
adding registers inside processor (处 理 器 中 的 加 
入 寄存 能 )，22-23 
alignment of word operands ( 字 操 作 数 的 对 齐 )， 
32-34 
endianness( 字 节 序 )，30-32 
memory address specification (内 存 寻 址 规范 )， 
26-27 
operand location and (操作 数位 置 )，22-26 
operand packing and (操作 数 打 包 )，32-34 
operand width and (操作 数 宽度 )，27-30 
Extended (ext) file system ,Linux (可 扩展 文件 系统 ， 
Linux), 509 
External fragmentation (外 部 碎片 )，287，305，478 
External interrupts〈 外 部 中 断 )，219 


F 

Fast Ethernet (快速 以 太 网 )，742-743 

Fast page mode ( FPM), DRAM (快速 页 模式 ， 
DRAM), 413-414 

Fault intolerance, processor design and (容错 ， 处 
理 器 设计 )，69 

Faulting page, loading (页 错误 ， 加 载 )，320 

Faulting process. See Page fault (错误 处 理 ， 参 见 页 
错误 ) 

FBUF buffer, pipeline register ( FBUF 缓冲 区 ， 流 
KARAT FF RE), 182-183 

Feedback line, pipelined processor (反馈 线路 ， 流 
水 线 处 理 器 )，187 


Fence register, memory management and (栅栏 寄 
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仓促 ， 内 存 管理 )，281 
Fetch and execute stages ( 取 指 令 和 执行 阶段 )，175 
FETCH macro state (FETCH 宏 状态 )，91，99-102 
Fiber distributed data interface (FDDI) (光纤 分 布 式 
数据 接口 )，678 
Field programmable gate arrays (FPGAs) (现场 可 编 
fel JS), 120-121 
Figures of merit (性 能 系数 )，476-477 
File allocation table (FAT)( 文 件 分 配 表 )，481-483 
File systems (文件 系统 ) 
allocation strategy comparison (分 配 策略 的 比 
较 )，490 
attributes of (属性 )，469-475 
CD-ROM and CD-R (CD-ROM 和 CD-R), 508-509 
components of (ZH f4), 498-503 
consistency check (一 致 性 检查 )，508 
contiguous allocation and (连续 分 配 )，477-480 
creating and writing files (创建 和 写 文件 )，499-500 
device driver and (设备 驱动 程序 )，499 
disk driver handling and (磁盘 驱动 絮 人 处理)， 
501-502 
figures of merit for (性 能 系数 )，476-477 
file allocation table (FAT) (文件 分 配 表 )，481-483 
hybrid indexed allocation and (混合 索引 分 配 )， 
486—491 
indexed allocation and (索引 分 配 )，483-485 
information flow and (信息 流 )，501 
journaling (日 志 )，514-515 
layout on the physical media (物理 介质 上 的 布 
局 )，503-507 
linked allocation and〔( 链 式 分 配 )，480-481 
Linux, 509-515 
media independent layer (媒介 独立 层 )，498-499 
media specific requests scheduling layer (媒介 请 
求 调度 层 )，499 
media specific storage space allocation layer ( 媒 
介 存 储 空间 分 配 层 )，499 
in memory data structures and (存储 于 内 存 中 的 
数据 结构 )，507 
Microsoft Windows, 515-517 
multilevel indexed allocation and (多 层 索 引 分 
fic), 485-486 
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physical media and (物理 媒介 )，508-509 
subsystem interactions and ( 子 系统 交互 )，S$00-503 
system crashes and (系统 月 演 )，508 
File transfer protocol (FTP)( 文 件 传 输 协 议 )，706 
Fine-grain critical sections ( 细 粒 度 临 界 区 ), 545-546 
Fine-grained parallelism ( 细 粒 度 并 行 性 )，601 
Finite state machine (FSM)( 有 限 状 态 机 ) 
control unit as (控制 单元 )，89-91 
for CPU datapath (CPU 数据 通路 )，98-99 
with disabled interrupts added (添加 了 关闭 中 断 
指令 )，139 
instruction execution and (指令 执行 )，173 
modifications to for handling interrupts (为 处 理 
中 断 而 修改 )，136-137 
sequential logic circuits and (时 序 逻 辑 电 路 )，90-91 
Firewire (火线 )，462 
First-come first-served (FCFS)( 先 到 先 服务 )，247- 
252, 453 
First fit (首次 适应 )，289 
First in first out ( FIFO) page replacement (先进 先 
出 页 替换 策略 )，327-329，333-335 
First-level caches (一 级 缓存 )，357 
Fixed-size partitions (固定 分 区 )，286-287 
Flash memory (闪存 )，439，461 
Flexible placement (灵活 替换 ) 
fully associative cache and (全 相关 高 速 缓存 )， 
385-387 
reducing the miss penalty and (降低 缺失 损失 )， 
393-394 
set associative cache (设置 组 相关 缓存 )，387 
set associativity extremes and (组 相关 的 极端 情 
i 元 )，387-392 
Flip-flop memory element (触发 器 记忆 元 件 )，78 
Floating-point instructions 〈 浮 点 指令 )，67 
Floating-point pipelines ( 浮 点 流水 线 )，217 
Flush control lines, pipelined processor (冲刷 控制 
EPS, VAL7KARAh FRE), 205 
Flushing (冲刷 )，212，320 
Fortran monitoring system (FMS) (FORTRAN 监控 
A), 13, 273 
Fortran programming language ( Fortran 编程 语言 )， 
16, 273 
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Forward error correction (FEC)( 前 向 纠 错 )，635，648 

Forwarding table (转发 表 )，668 

Four-port switch (四 端口 交换 机 )，681 

Four-way set associative cache organization (四 路 组 
相关 缓存 结构 )，389 

Fragmentation ( 片段 )，286-287 

Frame pointer ( 帧 指针 )，S5-58 

Frame relay ( 帧 延迟 )，685 

Frame table ( 帧 页 表 )，319 

free BSD, UNIX operating system ( free BSD, 
UNIX 操作 系统 )，274，697 

Free-list (空闲 表 )，318-320，336-338，478 

Free page frames pool (空闲 页 帧 池 )，336-338 

Frequency division multiplexing (FDM )( #47 FA), 


631, 669 
Front end, microarchitecture (Hilt, ik AZ), 
223—224 


Full-duplex modem (全 双 工 调制 解 调 侣 )，710 
Full flag, FIFO page replacement ( 满 标志 ，FIFO 
页 符 换 策略 )，327 

Fully associative cache (全 相关 高 速 缓存 )，38S-387 
Function calls ( 因数 调用 ) 

activation records and (活动 记录 )，54 

frame pointer and (Wł&g ft), 55-58 

procedure calling chores (过 程 调用 剩余 的 工作 )， 

46-47 

recursion (3619), 54-55 

software convention and (软件 惯例 )，47-53 

state of the caller (调用 者 状态 )，43-45 


G 

Gang scheduling (组 调度 )，591-592 

Garbage collection (垃圾 回收 )，68 

Gateway routers (XEK at), 657 

General Electric, 310 

General purpose graphic processing unit (GPGPU ) 
(381 FPA Ah a), 602 

GENI ( Global Environment for Network Innovation ), 
651 

Geometric mean (GM) (几何 平均 数 )，162-163，170 

gethostbyname, UNIX command, (gethostbyname, 
UNIX 命令 ) 727-728 


Global descriptor table (GDT)( 全 局 描述 符 表 )，312 

Global victim selection, page replacement and ( 全 
局 被 替换 ， 页 替换 策略 )，326 

Gnu software foundation (GNU 软件 基金 会 )，274 

Google Earth, 2, 3f 

Grand challenge problems (大 挑战 问题 )，226 

Granularity, operand width (粒度 ， 操 作 数 宽度 )， 
27-30 

Graphical user interface (GUI) (图 形 用 户 界面 )，2， 
13; 275 

Graphics display data rates (图 形 显 示 数 据 传 输 速 
率 )，439 

Graphics processing unit (GPU) (图 形 处 理 单元 )， 
68, 602 

Grid computing (网 格 计算 )，13-14，264-266 


H 
Handler procedure, interrupts (处 理 过 程 ， 中 断 )，133 
Hansen, Brinch, 586 
Hard link, file systems ( 硬 链接 ， 文 件 系 统 )，471 
Hardware-based speculation, pipelined 
processor (基于 硬件 的 投机 执行 ， 流 水 线 处 理 
ait), 218 
Hardware buffer, DMA controller (硬件 缓存 ， 
DMA 控制 部 )，429 
Hardware for handling discontinuities (处 理 程 序 不 
连续 性 的 硬件 )，143-149 
Hardware multithreading (硬件 多 线程 )，596-599 
Hardware organization, in desktop computer 
system (硬件 组 织 ， 在 桌面 计算 机 系统 中 )， 
8—10, 9f 
Hardware resource organization, pipelined 
processor (硬件 资源 组 织 ， 流 水 线 处 理 器 )，180 
Hardware/software interface (硬件 /软件 接口 )， 
4，4f 
Hardwired control ( 硬 连 线 控 制 )，119-121 
Harmonic mean ( HM) (调和 平均 数 )，162-163， 
170 . 
Head assembly, disk (磁头 组 件 ， 磁 盘 )，440 
Hennessy, John, 158 
Hidden terminal problem (隐藏 终端 问题 )，674_675 
Hierarchical name in UNIX, file systems ( UNIX 中 
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的 层次 化 名 称 ， 文 件 系统 )，491 

Hierarchical routing (分 层 路 由 )，657-658 

High-level data abstractions (高 级 数据 抽象 )，35-37 

High-level languages (高 级 语言 )，3，20-21，158 

High-performance computational resources (高 性 能 
计算 资源 )，265 

High-performance computing (HPC) (高 性 能 计 
算 )，266 

High water mark, thrashing control ( EPIR, Mit? 
itil), 342 

Hit, caches (mF, RFF), 356 

Hit rate, caches (命中 率 ， 缓 存 )，356 

Hoare, Tony, 586 

Hold and wait, deadlocks ( 持 有 并 等 待 )，583 

Hold time, register clocking (保持 时 间 ， 寄 存 器 时 
钟 周期 )，94 

Holes, memory allocation ( 洞 ， 内 存 分 配 )，288 

Horizontal microcode (水 平 微 码 )，119 

Host，networking terminologies (主机 ， 网 络 术 
语 )，621 

HTTP ( hyper-text transfer protocol) ( 超 文本 传输 协 
以 )，633 

Hubs, networking hardware (集线器 ， 网 络 硬件 )， 
679-680 

Hybrid architecture style (混合 体系 结构 风格 )，59 

Hybrid indexed allocation, file systems (混合 索引 
Stic, MFRS), 486-491 

Hyperthreading ( 超 线程 )，599 


| 
I-MEM (instruction memory)( 指 令 内 存 )，176 
IBM, 31, 59, 273, 309-310, 434, 599, 604 
IBSYS (IBM 7094 operating system) (IBM 7094 操 
(ERB), 13 
ID/RR stage, pipelining (ID/RR 阶段 ， 流 水 线 )， 
176—180 
IEEE 802.3, 673-674 
IEEE 802.11, 674 
IF stage, pipelining (IF 阶段 ， 流 水 线 )，176-180 
If-then-else statement (If-then-else 语句 )，38-40 
Immediate values (立即 值 )，23-24 
Implementation, scheduler evaluation and (实现 ， 调 


BEAR FI), 266-267 
Implicit parallelism ( 隐 式 并 行 )，214 
Imprecise exception ( 非 精 确 异 常 )，219 


. In memory data structures, file systems (内 存 的 数 


据 结 构 ， 文 件 系统 )，507 
Index node (i-node) (#45| 7 x4), 483, 491-492, 
497-498, 512 
Indexed allocation, file systems and (索引 分 配 ， 文 
(FAB), 483-485 
Indirect access, ISA and (间接 访问 ，ISA )，358 
Indirect addressing modes (间接 寻 址 模式 )，58 
Inkjet printer data rates ( 喷 墨 打印 机 数据 传输 速 
率 )，439 
Input buffers, switches and (输入 缓冲 区 ， 交 换 机 )， 
669 
Input/output (IO)( 输 入 /输出 ) 
bound workload and ( 受 限 负载 )，266 
burst and (X8), 242, 243, 260-261 
bus evolution and (总 线 演化 )，461-463 
completion interrupt handler and (IO Së IR "P Wr 
处 理 程 序 )，263 
CPU communication and (CPU 通信 )，423-427 
device controller and (设备 控制 器 )，424-425 
memory mapped (内 存 映射 )，425-427 
processors and ( 处理 器)，433-434 
programmed (程序 )，427-429 
queue and (队列 )，243，244 
request trap and (RKA ), 263 
super I/O (超级 IO )，465 
Instant messaging (IM) (即时 消息 )，631 
Instruction and data caches (指令 和 数据 缓存 )， 
392-393 
Instruction formats (指令 格式 ) 
all instructions same length, (所 有 指令 ， 相 同 长 
度 )61 
architectural choices and (体系 结构 类 型 )，59-62 
instruction format variable lengths (指令 长 度 可 
AE), 62 
one-operand instructions ( 单 操作 数 指令 )，60 
three-operand instructions (三 操作 数 指令 )，60 
two-operand instructions ( 双 操 作 数 指令 )，60 
zero-operand instructions ( 零 操 作 数 指令 )，59-60 
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Instruction frequency (指令 频率 )，160-161 
Instruction issue (指令 发 射 )，215 
Instruction-level parallelism ( ILP) (指令 级 并 行 )， 
214, 596, 598—600 
Instruction pipeline (指令 流水 线 ) 
buffering and (缓冲 )，178 
datapath elements for (数据 通路 元 率 )，178-180 
fixing problems with (修正 问题 )，176-178 
passage of instructions through (指令 经 过 )，177 
Instruction-processing assembly line (指令 处 理 的 流 
KX), 172-175 
Instruction register (IR)( 指 令 寄存 器 )，79 
Instruction restart, hardware for (指令 
FF), 318 
Instruction-set architecture (指令 集 架 构 ) 
additional addressing modes and( 其 他 寻 址 模式 )， 
58-59 | 
additional instructions and (其 他 指令 )，58 
architecture styles (架构 风格 )，59 
datapath (数据 通路 )，93-94 
instruction formats (指令 格式 )，59-62 
Instruction set design (指令 集 设计 ) 
applications and (WH), 18-19, 67—68 
issues and (问题 )，66-67 
process of (过 程 )，20-21 
programming languages and (编程 语言 )，18-19 
Instructions per clock cycle (IPC) (每 时 钟 周期 的 指 
4%), 171 
INT macro state (INT RIRA), 136-137, 147-149 
Integrated drive electronics (IDE) (电子 集成 驱动 
fit), 450 
Intel 8080/8085 single-chip processors (Intel 8080/8085 
单 芯片 处 理 器 )，274 
Intel Core microarchitecture ( Intel Core fi 32 #4 ), 
222-225 
Intel Pentium, 312-313 
Intel x86, 31, 66 
Inter-thread synchronization (线程 间 同 步 )，575 
Interactive environments (交互 式 环境 )，240 
Interactive video games, ISA and (交互 式 视频 游戏 ， 
ISA), 68 
Interconnection networks (互联 网 络 )，599-600 


a, AE 


Interface message processor (IMP) (接口 报 文 处 理 
HL), 712 
Interleaved memory (交错 式 内 存 )，407-408 
Internal fragmentation (内 部 碎片 )，286，305，478 
Internal representation of condition variable data type 
(条 件 变量 数据 类 型 的 内 部 表示 )，551-552 
Internet 
addressing (tit), 658-663 
621-622 
evolution of (#74), 712-713 
transmission control protocol and( 传 输 控 制 协 议 )， 
648—649 
transport protocols and (传输 协议 )，648-651 
user datagram protocol and (用 户 数据 报 协 议 )， 
648—650 
Internet protocol stack (Internet 协议 栈 ) 
application layer (应 用 层 )，628 
IP address (IP 地 址 )，559-563，625，687 
link layer ( 链 路 层 )，629-630 
network layer (网 络 层 )，629 
networks (网 络 )，660-662 
physical layer (物理 层 )，630-631 
transport layer (传输 层 )，629 
Internet service provider (ISP)( 互 联网 服务 提供 商 )， 
622, 625, 662 
Interrupt controller (PrP ml), 145 
Interrupt enable (中 断 人 允许 位 )，424 
Interrupt flag (中 断 标志 位 )，424 
Interrupt handling (中 断 处 理 )，150-152 
Interrupt mechanisms at work (工作 中 的 中 断 机 制 )， 
150-152 
Interrupt mode (中 断 模 式 )，154 
Interrupt vector (PWr), 146-147 
Interrupt vector table (TVT)( 中 断 问 量 表 )，134，149 
Interrupts (Mf), 131-132. See also Program 
discontinuities (参见 程序 不 连续 性 ) 
Invalid pages, page fault handling and (无 效 页 ， 页 
错误 处 理 )，320 
Inverted page tables ( 反 向 页 表 )，349 
iPhone OS X, 17 
iPod, 423 
ISO-Transport Protocol (ISO- 传输 协议 )，651 


characteristics of (特点 ), 
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Issue order, pipelining and (发 射 顺序 ， 流 水 线 )， 
217-218 


J 
JALR instruction (JALR #44), 106-108 
Java programming language (Java 编程 语言 )，586-589 
Job control language (JCL) (作业 控制 语言 )， 
240, 273 
Journaling file systems (日 志文 件 系统 )，514-515 
Jump table switch statement implementation And (Hk 
FEB, switch 语句 实现 )，40-41 


K 
Kahn, Robert, 742 
Kernel-level threads (内 核 级 线程 )，570-573 
Kernel mode (内 核 模 式 )，148，149 
Kernel space (内 核 空间 )，281-282 
Kernighan, Brian, 17 
Keyboard (键盘 )，424_ 425，439-440 
Kilby, Jack, 16 
Killer micros (ASFA b has), 123, 226, 614 
Kleinrock, Leonard, 712 
KSR-1, multiprocessor from Kendall Square 
Research (KSR (boat), 604, 618 


L 
L1 cache (L1 F), 416 
L2 cache (L2 缓存 )，416 
Lamport, Leslie, 608 
Larrabee, Intel processor ( Larrabee, Intel 处 理 
fit), 602 
Laser printer data rates (激光 打印 机 数据 传输 速 
率 )，439 
Last-in-first-out (LIFO) property (后 进 先 出 特性 )，44 
Last write time, file systems attributes and (上 次 写 
和信 时间， 文件 系统 属性 )，471，474 
LC-2200 
control unit (控制 单元 )，118 
hazards in ( B K), 211 
instruction format (指令 格式 )，63--65 
J-type instructions (jair)(J 类 型 指令 )，63 
l-type instructions (addi，lw，sw，beq)(I 类 


型 指令 )，63 
O-type instructions (halt)(O 类 型 指令 )，65 
R-type instructions (add, nand)(R 类 型 指令 )，63 
register convention and (寄存 天 惯例 )，65 
Least recently used ( LRU) algorithm (最 少 使 用 
FAIL), 329-333 
cache replacement and (F), 394-396 
push down stack for ( F#EFE), 330 
reference bit per page frame and (每 个 页 帧 引用 
fZ), 332-333 
small hardware stack and (小 的 硬件 栈 )，331-332 
Least significant byte (LSB)( 最 低 有 效 字 节 )，29，30 
Legacy software (遗留 软件 )，77 
Level logic ( 电 平 逻辑 )，80 
Lightweight process (lwp)( 轻 量 级 进程 )，573 
Link layer, Internet ( 链 路 层 ，Internet)，629-630 
Link-layer protocols ( 链 路 层 协议 ) 
asynchronous mode transfer (异步 模式 传输 )，678 
CSMA/CD, 671-673 
Ethernet and (LAA), 670-671 
fiber distributed data interface (FDDI) (光纤 分 布 
式 数 据 接 口 )，678 
IEEE 802.3, 673-674 
IEEE 802.11, 674 
point to point protocol (PPP )( 点 对 点 协议 )，678 
token ring ( 令 牌 环 )，675-677 
wireless LAN (无 线 局 域 网 )，674-675 
Link state routing algorithm ( 链 路 状态 路 由 协议 )， 
653—655 
Linked allocation, file systems and ( 链 式 分 配 ， 文 
件 系统 )，480-481 
Linker (#4), 235 
Linux Ext3, 515 
Linux file system (Linux 文件 系统 )，509-515 
Linux scheduler (Linux 调度 器 )，270-273 
Little endian (7h), 31-32 
Livelocks (7 #i), 546-548, 560 
Load and store instructions (加 载 和 存储 指令 )， 
24-25, 197-199 
Load time, static relocation (JN@AT la), HAS BEE 
位 )，283 
Loader (JMÆR4*), 235, 241 


索 žl 


Local area networks (LAN)( 局 域 网 ) 
birth of (产生 )，713 
evolution of (演变 )，713-715 
fast Ethernet and (快速 以 太 网 )，714-715 
at home (在 家 里 )，625 
technology breakthroughs and (技术 突破 )，615 
thicknet and ( 粗 缆 网 络 )，713 
thinnet and (HR), 713-714 
Local descriptor table ( LDT), Intel Pentium (局 部 
描述 符 表 ，Intel Pentium), 312 
Local victim selection, page replacement and (局 部 
被 替换 选择 ， 页 替换 )，326 
Locality principle (局 部 性 原则 )，339，355 
Lock algorithm with test-and-set instruction (使 用 
Test-and-Set 指令 的 Lock #3), 577-578 
Log segments, journaling file systems and (日 志 段 ， 
日 志文 件 系统 )，514 
Logic gates (逻辑 门 )，14 
Logical cylinder for a disk (磁盘 逻辑 柱 面 )，440- 
441, 451 
Logical page, virtual memory and (逻辑 页 ， 虚 拟 
AFF), 291 
Long-term scheduler (长 期 调度 程序 )，241 
Longitudinal recording, disk and (水 平 记 录 ， 磁 
盘 )，450 
LOOK algorithm, disk scheduling and (LOOK 算法 ， 
磁盘 调度 算法 )，455-457 
Loop-level parallelism (循环 级 别 并 行 性 )，613 
Lovelace, Ada, 16 
Low pin count (LPC) bus (LPC 2%), 65 
Low processor utilization, thrashing and ({IKAbHH at 
AHR, FOIE), 338 
Low water mark, thrashing contro (#R W FPR, Ail 
艇 控制 ) 1, 342 
Lowerbound clock cycletime (时 钟 周期 的 下 限 )，94 
LW (load word) instruction (LW 指令 )，108-111 


M 
MAC Address, link layer and (MAC 地 址 ， 链 路 层 )， 
682-684 
Mac computers (MAC 计算 机 )，275 
Mac iPhone OS, 13 


513 


Mac OS X, 17 
Macro-fusion, microarchitecture and ( 宏 合 并 ， 微 
架构 )，224 
Macro states, control unit and ( 宏 状态 ， 控 制 单 元 )， 
90，172 
Magnetic core memory( 磁 心 存储 器 )，12，13f 
Magnetic disk schematic (磁盘 )，441 
Magnetic media (磁性 介质 )，449 
Main memory design considerations ( 主 存 的 设计 因 
%), 405-408 
Mainframe computers (AAYHL), 226, 273, 710 
malloc, C library call (malloc, C 库 调 用 )，574 
Manchester code (曼彻斯特 码 )，673 
Many-core architecture (多 核 架 构 )，69，610-611 
Mapping, virtual memory and (上 映射， 虚拟 内 
存 )，291 
Maskable interrupts (可 屏蔽 中 断 )，153 
Master boot record ( 主 引导 记录 )，5$04 
Master file table (MFT)( 主 文件 表 )，516-517 
Master-slave relationship, bus action and ( 主 - 从 
KA, 总线 操作 )，433 
Math libraries (数学 库 )，19 
Mauchly, John, 15, 273 
Maximum precision, arithmetic operations (最 大 精 
度 ， 数 学 操作 )，28 
MBUF buffer, pipeline register (MBUF 组 冲 器 ， 
流水 线 寄 存 器 )，182--183 
Media access control (MAC) (介质 访问 控制 )， 
670, 682 
Media independent layer (媒介 独立 层 )，498-499 
Media specific requests scheduling layer (媒介 请 求 
调度 层 )，499 
Media specific storage space allocation layer (媒介 
存储 空间 分 配 层 )，498-499 
Medium-grained parallelism (中 粒度 并 行 性 )，603 
Medium-term scheduler (高 级 调度 器 )，241 
MEM stage, pipelining (MEM 阶段， 流水 线 )， 
177—180 
Memory (内 存 ) 
access time and (访问 时 间 )，180 
address in an instruction( 在 指令 中 寻 址 )，26-27 
addressability problem and (可 寻 址 性 问题 )，23 


514 


bandwidth and (F wa), 393 

basic concepts and (基本 概念 )，81-82 

bounds and (限制 )，282-284 

cache coherence and (fr — 5E), 607—610 

costs and (开销 )，158 

density and (密度 )，68 

footprints and (FERIE), 32, 157, 170 

in single threaded and multithreaded processes ( 单 
线程 进程 和 多 线程 进程 )，567 

interleaving and (交错 )，406 

interpretation for set associative cache (组 相关 组 
仔 的 翻译 )，389 

LC-2200 requirements and (LC-2200 需求 )，92 

memory address register (内 存 地 址 寄存 器 )，92 

memory oriented architecture style( 面 回 内 存 的 
体系 结构 )，59 

memory wall (内 存 增 )，68 

operand addressability and (操作 数 可 寻 址 性 )，28 

operating system and (操作 系统 )，237 

page tables in ( #1 #2), 291-295 

pressure and (JE JJ), 341 

processor design and (处 理 需 设计 )，68-69 

protection (保护 )，279，566 

register loading from (RA 477748), 25-26 

relative sizes of (相对 大 小 )，296-297 

role of (作用 )，79 

space separation and (空间 的 分 隔 )，268 

stalls and (%EI8 ), 369, 376-377 

store instructions and (存储 指令 )，431 

user program and (用 户 程 序 )，237 


Memory allocation schemes (内 存 分 配方 案 ) 


best fit and (最 佳 适 应 )，289 

compaction and〈 缩 并 )，289-290 

first ft and (首次 适应 )，289 

fixed-size partitions and (固定 长 度 分 区 )，286-287 
variable-size partitions and (可 变 长 度 分 区 )，287-289 


Memory hierarchy (内 存 层 次 ) 


basic terminologies and (基本 术语 )，355-356 

block size performance implications ( 块 大 小 对 性 
能 的 影响 )，383-384 

cache concept and( 绥 存 的 概念 )，354-355 

cache controller and (224772 til at), 400 


% žl 





cache design considerations and (2847111 AY 4 IE), 
404 

cache misses in processor pipeline and (处 理 器 流 
水 线 中 的 缓存 缺失 )，375-377 

cache organization and ( 绥 存 组 织 )，360 

cache read/write algorithms and ( 2& F iz / 5 F 
E), 370-375 

cache replacement policy and ( 绥 存 替换 策略 )，394_ 
396 

direct-mapped cache organization and ( 直接 映射 
缓存 的 组 织 结构 )，360-339 

flexible placement and (灵活 替换 )，384-392 

instruction and data caches (指令 和 数据 缓存 )， 
392 一 393 

locality principle and (局 部 性 原则 )，355 

main memory design considerations ( 主 存 的 设计 
因素 )，405-408 

modern main memory system elements and (现代 
主人 存 系统 分 析 )，408-412 

modern processor example (现代 处 理 器 实例 )， 
418-419 

multilevel memory hierarchy (多 级 存储 体系 )， 
351—360 

multiprocessors and (AhIE#%), 580-582 

page mode DRAM and (页 模式 DRAM), 412-415 

performance implications of (性 能 影响 )，415-416 

pipelined processor design and (流水线 处 理 器 
设计 )，369 

relative sizes and latencies of (相对 大 小 和 延 
WS), 416 

spatial locality to improve cache 

performance (利用 空间 局 部 性 提高 缓存 性 
HE), 377-384 

virtually indexed physically tagged cache (虚拟 

索引 物理 标记 的 缓存 )，401-402 


Memory management (内 存 管 理 ) 


concurrent processes and (并 发 进程 )，280 
controlling thrashing and (44 fill Me), 341-342 
dynamic relocation and (动态 重 定位 )，284-285 
functionalities provided by (提供 的 功能 )，278-280 
improved resource utilization and (提高 资源 利 


用 率 )，278 


过 3/ 


interactions with process scheduler (id Fe Hal BE dit 
的 交互 )，324-325 

optimization and (优化 )，336-342 

overall goals of (总 体 目 标 )，280 

overlapping I/O with processing (处 理 过 程 中 的 
IO ##), 337 

paged virtual memory (分 页 虚拟 内 存 )，290-297 

paging vs. segmentation (分 页 和 分 段 )，303-308 

pool of free page frames and (空闲 页 帧 池 ), 336-338 

program locality and (程序 的 局 部 性 )，721-722 

resource limitations and (资源 限制 )，279 

reverse mapping to page tables and (页 表 的 反问 


Wet), 338 
segmented virtual memory and (分 段 虚 拟 内 存 )， 
297-303 


simple schemes for ( faj 47738), 280-285 
static relocation and (静态 重 定位 )，282-284 
thrashing and (Hif), 338-340 
user and kernel separation and( 用户 和 内 核 分隔 )， 
281-282 
working set and ( TE), 340-341 
Memory mapped I/O (A fFHRAY 1/0), 425-427 
Mesh interconnection network (网 格 结构 的 互联 网 
络 )，599 
Message-passing interface (MPI) (消息 传递 接口 )， 
604 
Message-passing multiprocessors (消息 传递 型 多 处 
FEZ% ), 603-606 
Message switching ( 报 文 交换 )，666，669 
Message transmission time ( 报 文 传输 时 间 )，688-690 
Meta-schedulers (元 调度 大 )，264-265 
Metadata (元 数据 )，367，373，469，685 
Microchip development ( 微 芯 片 的 发 展 )，12 
Microcode ROM access (访问 微 指令 ROM), 216 
Microprograms ( 微 程序 )，119 
Microsoft, 14, 274-275 
Microsoft Windows, 13, 515-517 
Microstates, control unit and( 微 状态 ， 控 制 单元 )， 
96, 159 
Minicomputers (小 型 计算 机 )，226 
MINIX file system (MINIX 文件 系统 )，509 
MINIX operating system (MINIX 操作 系统 )，17，274 


515 


MIPS technologies (MIPS 技术 )，31，58 

Miss penalty (HERRA), 356, 377, 393-394 

Miss rate (KR), 356, 377 

mkdir, UNIX command (mkdir, UNIX fit), 475, 494 

MMX instructions (MMX 484), 67 

Modeling, scheduler evaluation and ( 建 模 ， 调 度 器 
评价 )，266-267 

Modems ( iil iii] Meat), 439, 710-712 

Modern language support, processor design And ( 
代 语 言 支持 ， 处 理 器 设计 )，68 

Modern memory systems (现代 内 存 系统 )，408-415 

Modified interrupt handler (修改 后 的 中 断 处 理 过 
程 )，139 

Monitor programming construct( 管 程 编程 结构 )，586 

Moore, Gordon, 1, 16, 16f 

Moore’s law (摩尔 定律 )，613 

Most significant byte (MSB)( 最 高 有 效 字 节 )，29，30 

Mouse data rates ( 鼠标 的 数据 传输 速率 )，439-440 

Motherboard (主板 )，77，357，463-464 

MS-DOS, 274, 565 

Multi-level page tables (多 级 页 表 )，346-348 

Multi-port repeater, networking hardware (多 端口 
的 中 继 器 ， 网 络 硬件 )，679 

Multicast (组 播 )，684 

Multicore architectures (多 核 架 构 )，69，610-611 

Multicore chips (多 核 必 片 )，123-124 

Multicore processor design (2% 4% Xb H #& iz bt ), 
221—222 

Multics (MULTICS), 274, 310-313 

Multilevel directory, file systems and (多 级 目录 ， 
文件 系统 )，470 

Multilevel indexed allocation, file systems and ( 多 
层 索 引 分 配 ， 文 件 系统 )，485-486 

Multilevel memory hierarchy (多 级 存储 体系 )， 
357-360 

Multiple access, Ethernet and (多 路 访问 ，Ethernet)， 
672 

Multiple decode units (多 个 解码 单元 )，215 

Multiple functional units, microarchitecture 
and (多 个 功能 单元 ， 微 架构 )，215，216-217 

Multiple instructions multiple data (MIMD) (多 指令 
多 数据 流 )，603 


516 


过 3/ 





Multiple instructions single data ( MISD) (多 指令 单 
数据 流 )，602-603 
Multiple issue processors (2 Ae Hf 4h FH a), 124, 
215-216 
Multiplexing (多 路 选择 器 )，103，434 
Multiprocessors (2 XbFi gt), 578-582. See also 
Parallel architecture (参见 并 行 体系 结构 ) 
cache coherence and( 绥 存 一 致 性 )，580-581，604 
characteristics of (特点 )，222 
ensuring atomicity and (保证 原子 性 )，582 
gang scheduling and (组 调度 )，591-592 
memory consistency and ( 内存 一 致 性 )，607-610 
memory hierarchy and (内 存 层次 )，580-582 
message passing versus (消息 传递 )，603;606 
noncache coherent ( 非 缓 存 一 致 )，604 
page tables and (页 表 )，579 
scheduling and (调度 )，589-592 
space sharing and (空间 共享 )，589-592 
Multiprogrammed scheduling environments (多 程序 
调度 环境 )，239-240 
Multithreading (多 线程 ) 
advanced synchronization algorithms and ( 高 级 
同步 算法 )，586-589 
atomic test-and-set instruction and ( 原 子 的 Test- 
and-Set 指令 )，575-577 
atomicity for group of instructions (一 组 指令 的 
原子 性 需求 )，543-544 
basic code with no synchronization (无 同步 的 基 
本 代码 )，541-543 
code refinement with coarse-grain critical sections 
(使 用 粗 粒 度 临 界 区 的 代码 改进 )，544 
code refinement with fine-grain critical sections 
(使 用 细 粒 度 临 界 区 的 代码 改进 )，545-546 
communication among threads (线程 间 通 信 )， 
526-527, 574-575 
concurrency problems and (并 发 问题 )，592-596 
condition variables and (条 件 变 量 )，548-552 
deadlocks and livelocks and ( 死 锁 和 活 锁 )，546- 
548, 583-586 
hardware multithreading (硬件 多 线程 )，596-599 
hardware support for in uniprocessor (在 单 处 理 
机 上 进行 多 线程 的 硬件 支持 )，574-575 


important points in programming threads (线程 编 
程 的 一 些 注意 事项 )，561 

inter-thread synchronization and (线程 间 同 步 ). 
575 

internal representation of data types (数据 类 型 的 
内 部 表示 )，540-54] 

kernel-level threads ( 内核 级 线程 )，570-573 

light-weight process (lwp)( 轻 量 级 进程 )，573 

lock algorithm with test-and-set instruction (使 用 
Test-and-Set 指令 的 Lock 算法 )，577-578 

multiprocessors and (多 处 理 器 )，、578-582，589-592 

nondeterminism and (不 确定 性 )，528-533 

OS support for threads ( 操作 系 统 对 线程 的 支持 ). 
565-574 

overlapping computation with I/O using (使 用 线 
fe, 在 IO 时 进行 计算 )，522-523 

POSIX pthreads library and ( POSIX pthread JÆ ), 
562-565 

race condition and ( 范 争 条 件 )，528-533 

read-write conflict and ( 读 写 冲突 )，528-533 

reasons for (原因 )，522-523 

simple programming examples (简单 的 编程 示 
例 )，541-546 

Solaris threads and (Solaris 线程 )，572-573 

thread creation and termination (线程 创建 与 终 
ik), 523-525, 574-575 

thread function call summary (k FE ek BC dal H 
24), 559-561 

thread synchronization and (线程 同步 )，533-540 

threads library safety (线程 库 安 全 性 )，573-574 

user level threads (用 户 级 线程 )，567-570，573 

using threads as software structuring 


abstraction (使 用 线程 作为 软件 结构 抽象 )， 


561—562 
video processing example and (视频 处 理 示 例 )， 
553-559 


Multiword block size (多 个 字 缓 存 块 大 小 )，379-381 
Multiword direct-mapped organization (多 字 直 接 映 


射 缓 存 组 织 结构 )，380 


MULTICS (multiplexed information and 


computing service (多 路 信息 和 计算 机 服务 )， 
274 


x Fl 


Siy 





Fe ), 534-536, 544- 
545, 547-548, 553, 558-560, 574, 594, 617 
Mutual exclusion ( 4} ), 533-537, 560, 583 


mutex, mutual exclusion ( 4. 


N 
Name equivalence, file systems and (在 名 称 上 等 价 ， 
文件 系统 )，472 
Name resolver, file systems and (名 称 解 析 器 ， 文 
件 系统 )，499 
NAND instruction (NAND 指令 )，106 
Negative-edge-triggered logic ( 负 边 沿 触发 逻辑 )，80 
Nesting, procedure calls and (#42, it#iiM AW), 44 
Network file system (NFS) (网 络 文件 系统 )，706-707 
Network interface card ( NIC) (网 F ), 621, 682- 
683, 697-698 
Network layer (24) ), 652-670 
Internet addressing and (因特网 寻 址 )，658-663 
network service model (网 络 服务 模型 )，663-668 
routing algorithms and (路 由 算法 )，652-658 
routing vs. forwarding (路 由 与 转发 )，668 
service model and (服务 模型 )，652 
Network service model (网 络 服务 模型 ) 
circuit switching and (电路 交换 )，663-664 
message switching and ( 报 文 交 换 )，666 
packet switching and (分 组 交换 )，664-668 
Networking (网 络 )。 参 见 specific layers 
application layer and (应 用 层 )，632-634 
applications and their transport protocols (网 络 应 
用 程序 和 传输 协议 )，651 
basic terminologies and (基本 术语 )，621-626 
data rates and (数据 传输 速率 )，439 
data structures for packet transmission (用 于 数据 
包 传 输 的 数据 结构 )，685-686 
device drivers (网 络 设备 驱动 程序 )，697-699 
higher-level protocols and (高 层 协议 )，706-708 
Internet evolution and (因特网 演变 )，712-713 
key networking terminologies (网 络 关 键 术 语 )，669 
link layer and local area networks ( 链 路 层 和 局 域 
网 )，670-678 
message transmission time and (消息 传输 时 间 ), 
688—694 
network buffers (网 络 缓冲 区 ), 698 


network congestion ( 网络 拥塞 )，625，643-644 
network layer and (网 络 层 )，652-670 
network protocol (网 络 协议 )，626 
network services (网 络 服务 )，706-708 
networked video games (联网 视频 游戏 )，5-8，6f 
networking gear summary (网 络 组 件 概要 )，684 
networking hardware (网 络 硬 件 )，678-683 
networking software (网 络 软件 )，626-628 
1GBase-T and 10GBase-T and ( 1GBase-T 和 
10GBase-T)，715 
PC and arrival ofthe LAN (个 人 计算 机 与 局 域 网 
的 出 现 )，713 
programming using UNIX sockets (使 用 UNIX 
和 套 接 字 进 行 网 络 编程 )，699-706 
protocol stack and (协议 栈 )，628-632 
protocol stack layer relationships (协议 栈 各 层 之 
间 的 关系 )，683-685 
sample network (示例 网 络 )，653 
software and operating system( 软件 和 操作 系统 )， 
695—699 
TCP/IP header (TCP/IP 包头 )，687 
from telephony to (从 电话 到 计算 机 网 络 )，709- 
712 
transport layer and (传输 层 )，634-651 
Networking hardware (网 络 硬件 ) 
bridges and switches (网 桥 和 交换 机 )，679-680 
hubs (224 #), 679 
network interface card (NIC) (网 卡 )，682-683 
repeater (‘PARR ), 679 
routers (FH 4), 683 
virtual local area networks (虚拟 局 域 网 )，682 
Networking software (网 络 软件 ) 
network device driver (网 络 设备 驱 动 程序 )，697-699 
protocol stack implementation and (协议 栈 实 现 )，697 
socket library (socket 库 )，695-697 
Next-state field, control unit and (下 一 状态 字段 ， 
控制 单元 )，116，117 
No-write allocate, write-miss handling ( 非 写 分 配 ， 
写 缺 失 处 理 )，373 
Noise burst, Ethernet and (噪声 脉冲 ，Ethermnet)，672 
Noncache coherent (NCC) multiprocessors ( 非 绥 存 
ELBA aE), 604 
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Nondeterminism, multithreading and (不 确定 性 ， 
多 线程 )，528-533 
Nondeterministic execution, 531, 560 ( 非 确 定性 
执行 ) 
Nonmaskable interrupts (不 可 屏蔽 中 汤 )，153 
Nonpreemptive scheduling algorithms ( 非 抢 先 调 度 
算法 )，245-256 
first-come first-serve( 先 到 先 服务 )，247-252 
priority and (优先 级 )，255-256 
shortest job first (最 短 作业 优先 )，252-255 
Nonrelocatable processes (不 可 重 定位 进程 )，283 
Nonzoned recording, magnetic disk and ( 非 分 区 
记录 ， 磁 盘 )，441-442 
NOP ( no-operation) instructions ( NOP 指令 )，186- 
187, 203-204 
Not retired instructions, microarchitecture and ( JẸ 
隐 退 指令 ， 微 架构 )，218 
Noyce, Robert, 16 
NT file system (NTFS)(NT 文件 系统 )，516-517 
Nvidia, GPU vendor (Nvidia, GPU 供应 商 )，602-603 


O 
Object reference (对 象 引 用 )，517 
Occupied bit (被 占 位 )，286 
Offset, page (WE, W), 293 
One-operand instructions ( 单 操作 数 指令 )，60 
Open source operating systems (开源 操作 系统 )，270 
Open systems interconnection (OSI) suite (开放 系统 
互 连 套件 )，631-632 
Operands (操作 数 ) 
addressability of (可 寻 址 性 )，22-23 
addressing mode and ( 寻 址 模式 )，24 
immediate values and (立即 值 )，23-24 
load and store instructions and (加 载 和 存储 指 
4), 24-25 
packing of (打包 )，32-34 
register addressing and (寄存 器 寻 址 )，24 
using registers and (使 用 寄存 句 )，22-23 
width of (SERE), 27-30 
Operating systems (OS)( 操 作 系 统 ) 
advanced synchronization algorithms and (高 级 


同步 算法 )，586-589 


deadlocks and (E), 583-584 
evolution of (演化 )，13-14 
instruction set design and (指令 集 设 计 )，19 
memory protection in( 内存 保护 )，566 
networking software and (网 络 软件 )，695-699 
processor design and (处 理 需 设计 )，68 
protocol stack implementation and (协议 栈 实现 )， 
097 
thread support and (线程 支持 )，13-14 
video games and (视频 游戏 )，5-8 
Optimization, memory management and (优化 ， 内 
存 管理 )，336-342 
Out-of-order delivery of packets (数据 包 的 乱 序 到 
达 )，627 
Out-of-order execution ( 乱 序 执行 )，217-218，224 
Out-of-order processing ( 乱 序 处 理 )，218-219 
Output buffers (输出 缓冲 区 )，669 
Overflow region, file systems and (X H X dk, X 
件 系统 )，480 
Overlapping I/O with processing (处 理 过 程 中 的 I/O 
mE), 337 
Owners, file system attributes and (拥有 ， 文 件 系 
RIRE), 471, 474 


p 
Packet arrival from network (网 络 数据 包 到 达 )，699 
Packet header (数据 包头 )，685 
Packet loss (数据 包 丢失 )，625，627，643，665，669 
Packet queues (数据 包 排 队 )，643 
Packet-switched networks (分 组 交换 网 络 )，667-668 
Packet switching (分 组 交换 )，664-666，669 
Packet transmission, data structures for (数据 包 
传输 ， 数 据 结构 )，685-686 
Packing of operands (操作 数 打包 )，32-34 
Padding, data structures and (填充 ， 数 据 结构 )， 
510-511 
Page-based memory management( 基 于 页 的 内 存 管理 ) 
access rights as part of page table entry (局 部 页 
表 项 的 访问 权限 )，348-349 
demand paging and ( 按 需 分 页 )，316-324 
inverted page tables and (IHK), 349 
multi-level page tables and (多 级 页 表 )，346-348 
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optimizing memory management (优化 内 存 管 
FH), 336-342 
page replacement policies ( 页 替换 策略 )，326-336 
process scheduler and memory manager (进程 调 
Ett AIAN AEE lat), 324-325 
translation lookaside buffer and (43764467828 | ), 
343-346 
Page coloring (H MÆ f), 403 
Page fault (页 销 误 ) 
anatomy of (页 错误 解析 )，320-324 
exceptions and (异常 )，317 
faulting page loading (加 载 缺 失 页 )，320 
finding free page frame and (发 现 一 个 空闲 页 帧 )， 
320 
handler (处 理 程序 )，318，320-324 
page table update and (更 新 页 表 )，321 
picking victim page and (挑选 被 奉 换 页 )，320 
rate reduction and (降低 页 错误 率 )，326 
restarting faulting process and (重启 缺 页 异常 
进程 )，321 
thrashing control and (AiR Hil), 341-342 
Page frames, virtual memory and (页 帧 ， 虚 拟 内 
存 )，290 
Page mode DRAM (页 式 DRAM), 412-415 
Page replacement policies (页 替换 策略 ) 
algorithm comparison and (算法 比较 )，337 
Belady’s Min and, 326-327 
first in first out and (先进 先 出 )，327-329 
global victim selection and(〈 全 局 被 奉 换 选择 )，326 
least recently used and (最 近 最 少 使 用 策略 )， 
329—333 
local victim selection and (局 部 被 蔡 换 选择 )，326 
random replacement and (随机 替换 )，327 
second chance page replacement algorithm (第 二 
次 机 会 页 蔡 换 算法 )，333-336 
Page table base register (PTBR), virtual 
memory and (页 表 基 址 寄存 器 ， 虚 拟 内 存 )， 
294-296, 351 
Page table entry (PTE)( RM), 295 
Page tables (014), 291-295 
access rights and (访问 权限 )，348-349 
demand paging and ( 按 需 分 页 )，317 


faulting process and (dR OL: HF VERE), 321 
inverted (反问 )，349 
multi-level (多 级 )，346-348 
multiprocessors and (4 AbhFEAE), 579 
Paged memory system, address computations 
in (分 页 内 存 系统 ， 地 址 计算 )，307 
Paged segmentation ( 页 式 分 段 )，306 
Paged virtual memory (分 页 虚拟 内 存 ) 
hardware for paging (支持 分 页 的 硬件 )，295-296 
page tables and (页 表 )，291-296 
relative sizes and (相对 大 小 )，296-297 
Paging daemon (分 页 守护 进程 )，333 
Paging hardware( 文 持 分 页 的 硬件 )，295-296 
Paging vs. segmentation (分 页 与 分 段 )，303-308 
Pan-tilt-zoom (PTZ) camera ( 云 台 变焦 摄像 机 )， 
436—438 
Parallel architecture (并 行 体系 结构 ). See also 
Multiprocessors (参见 多 处 理 器 ) 
multicore and many-core (多 核 与 众 核 )，610-611 
multiple instructions multiple data (MIMD )( 多 指 
令 多 数据 流 )，603 
multiple instructions single data (MISD) (多 指令 
单数 据 流 )，602-603 
single instruction multiple data (SIMD) ( 单 指 令 
多 数据 流 )，601-602 
single instruction single data (SISD) ( 单 指 令 单 
数据 流 )，600-601 
taxonomy, 600—601 
Parallel programs, execution models of (并 行程 序 ， 
执行 模型 )，533 
Parallel tag matching hardware (并 行 标记 位 匹配 人 硬 
件 )，386 
Parallelism, processor design and (并 行 性 ， 处 理 
Arbeit), 69 
Parameter passing, procedure call and (参数 传递 ， 
过 程 调 用 )，46 
Partitions (47 1X ) 
fixed size (固定 大 小 )，286-287 
layout and (布局 )，506 
table data structure and ( 表 数 据 结构 )，505-506 
variable size (变量 大 小 )，287-288 
Payload (有 效 载 人 向)，683 
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PDP-11 (Digital Equipment Corp.), 59 
Pentium processors (Pentium 4h% ), 67, 312-313 
Per-file information (每 个 文件 信息 )，507 
Performance metrics (性 能 度量 )，170，245-247，248 
Peripheral component interchange ( PCI) (外 围 组 件 
Ai), 432 
Peripheral devices (外 围 设备 )，438-440 
Perpendicular magnetic recording (PMR) (4 Hic 
se), magnetic disk (磁盘 )，450 
Personal computer (PC)( 个 人 计算 机 )，274，713 
Personal computer hard drive ( circa 2008 ) (电脑 的 
硬盘 驱动 ( 2008 年 左右 ) )，449 
Personal computer modem (个 人 电脑 调制 解 调 需 )， 
710-712 
Personal digital assistants (PDAs)( 个 人 数字 助理 )，266 
Pervasive computing domain ( 普 适 计算 领域 )，266 
Physical address extension ( PAE) feature (物理 地 
址 扩展 特性 )，297 
Physical frame number ( PFN) (物理 帧 号 )，293- 
296, 402—403 
Physical frames, virtual memory and (物理 帧 ， 虚 
WAFF), 290-291 
Physical layer, Internet (JZ, Internet), 630-631 
Physical media, file system layout and (物理 介质 ， 
文件 系统 布局 )，503-507 
Physical memory (物理 内 存 ) . See Memory (参见 内 存 ) 
Pin a page, memory management and (人 锁 住 物理 内 
存 中 的 页 面 ， 内 存 管理 )，343 
Pipeline-conscious architecture and Implementation 
(针对 流水 线 的 体系 结构 与 实现 ) 
anatomy of instruction passage (指令 穿 过 流水 线 
的 过 程 详解 )，181-183 
easy-decodable instruction format and (容易 解码 
的 指令 格式 )，180-181 
equal amounts of work in each stage and (确保 每 
个 阶段 的 工作 量 相同 )，181 
pipeline register design and ( jit 7K 2% A fF #5 HI iz 
it), 184 
pipeline stage implementation and (流水 线 各 个 
阶段 的 实现 )，185 
Pipeline depth, microarchitecture and〈 流 水 线 深度 , 
(HARRY), 215-218 


Pipeline hazards (流水线 冒险 ) 
clocks per instruction and( 每 指令 的 时 钟 周 期 数 )， 
186 
control hazards (控制 冒险 )，200-209 
data hazards (数据 冒险 )，187-200 
pipeline efficiency and (流水 线 的 效率 )，186 
structural hazards (结构 化 冒险 )，186-187 
Pipeline register (buffers) (MiK Arar (RPX) ) 
contents and (内 容 )，183 
design and (设计 )，184 
generic layout of (通用 布局 )，185 
with unique names ( 专 有 名 称 )，182 
Pipelined processor (流水 线 处 理 需 ) 
design and (设计 )，369 
program discontinuities in (程序 不 连续 性 )，211-214 
Pipelined protocols (流水 式 协 议 )，640-642 
bandwidth and (市 宽 )，640 
packet transmission with no ACKs (无 确认 的 包 
传输 )，540 
propagation time and (传播 时 间 )，640 
Pipelining (流水 线 )，171-172 
PlanetLab, 651 
Platter, disk and (fk Fr, Ri tk), 440-444, 448, 
479, 484-485, 504-505, 519 
Plug and play (Bld BI AI), 462 
Point of call, procedure call and (调用 点 ， 过 程 调 
Fl), 47 
Point to point protocol (PPP)( 点 对 点 协议 )，678 
Pool of free page frames (空闲 页 帧 池 )，336-338 
Positive acknowledgment, packet-level (肯定 确认 ， 
数据 包 级 )，635-636 
Positive-edge-triggered logic ( 负 边 沿 触发 逻辑 )，80 
POSIX pthreads library (POSIX pthreads JÆ), 562-565 
Power consumption (IJE), 77, 221-222 
Power PC, processor (PowerPC, XbdH#4E), 19, 123 
Precision of operands (操作 数 的 精度 )，27-30 
Preemptive scheduling algorithms (抢占 式 调 度 算 
法 )，242-243 ，256-264 
Prepaging, memory management and(〈 预 分 页 ， 内 
存 管 理 )，343 
Price-performance tradeoff, processor implementation 


And (PEt LEAL. ADR AES), 77 


过 3 


Principle of locality (局 部 性 原则 )，339，355 
Priority, processor scheduling and (优先 级 ， 处 理 
Aral FE), 255-255 
Priority-interrupt schemes (优先 级 中 断 机 制 )，144-- 
145 
Privileged instructions (特权 指令 )， 
Privileged mode (特权 模式 )，148 
Privileges, file system attributes and (权限 ， 文 件 
系统 属性 )，471，474 
Procedure calls (it Fé ial A ) 
compiling (编译 )，42-43 
high-level language and ( 高 级 语言 )，21 
parameter passing and (参数 传递 )，46 
return address and (返回 地 址 )，46 
return to point of call and (返回 调用 点 )，47 
return values and (返回 值 )，47 
shadow registers and (52-#y fF at), 43-44 
software convention and (软件 惯例 )，45 
space for callee’s local variables and (被 调用 者 
局 部 变量 的 空间 )，47 
transferring control to callee (将 控制 权 移交 给 被 
调用 者 )，46 
Process concept ( 进程 的 概念 )，720-721 
Process control block ( PCB) (进程 控制 块 )，243- 
244, 566 
Process independence, memory manager and (进程 
rte, PYF Han), 279 
Process scheduling (FEIE r), 242-245, 324-325 
Process termination trap handler (进程 终止 陷入 处 
SHAE). 263 
Processes, characteristics of (进程 ， 特 点 )，237-239 
Processing delay (人 处理 延 述 ) 
at the receiver (P24 onp HY ALTE REUS ), 690 
at the sender (Ai Mig AY Ab FH REUS ), 688-689 
Processor architecture and design (Ah FEFE FH 25 9 
与 设计 ) 
applications and instruction set design (应 用 程序 
与 指令 集 设计 )，67-68 
common high-level language feature set (% JL AY 
高 级 语言 功能 集 )，21 
compiling function calls (编译 函数 调用 )，42-58 
conditional statements and loops (条 件 语 句 和 循 


148, 281 


521 


Ye), 37-42 

deeper pipelines and (更 深 的 流水 线 )，215-218 

design issues and (设计 问题 )，68-69 

expressions and assignment statements and (表达 
式 和 赋值 语句 )，21-34 

high-level data abstractions (高 级 数据 抽象 )， 
35-37 

impact of scheduling on ( iA] HE XP Ab FR AAA R KN 
的 影响 )，267-268 

instruction-level parallelism and (指令 集 并 行 
性 )，214 

instruction-set architectural choices (指令 集体 系 
结构 选择 )，58-62 

instruction set design and (指令 集 设计 )，20-21 

instruction set issues (指令 集 问题 )，66-67 

Intel Core microarchitecture (Intel Core 微 架 构 )， 


222—225 

issues influencing (5% Mla] Zh BH AR ise iF AY TE i), 
66—69 

LC-2200 instruction set and ( LC-2200 指令 集 )， 
62—65 

managing shared resources and (管理 共享 资源 )， 
219-221 

multicore processor design (多 核 处 理 器 设计 )， 
221-222 


out-of-order processing and ( 乱 序 执行 )，218-219 

power consumption and ( 功 耗 )，228-222 

program discontinuities and (程序 的 不 连续 性 )， 
218-219 

Processor implementation (处 理 器 实现 ) 

alternate control unit design style (控制 单元 设计 
的 另 一 种 选择 )，119-121 

architecture vs. implementation (体系 结构 与 实 
现 )，76-77 

bus-based design and (基于 总 线 的 设计 )，86-89 

circuits and (电路 )，78 

clock pulse width and (时 钟 脉冲 宽度 )，94 

comparison of control regimes (控制 风格 比 
较为 121 

control unit design and (控制 单元 设计 )，95-96 

datapath design and (数据 通路 设计 )，91-93 

datapath element connections and (连接 数据 通路 
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的 元 件 )，82-86 
DECODE macro state (DECODE 宏 状态 )，102-- 
103, 116-119 
edge-triggered logic and (边沿 触发 逻辑 )，79-82 
engineering a conditional branch in 
microprogram (设计 微 程序 中 的 条 件 分 支 )，116 
EXECUTE macro state and (EXECUTE #4KAS), 


103-116 
factors involved in (Ab H 4h X M W R HAR), 
77-78 


FETCH macro state and (FETCH #4K25), 99-102 

finite state machine and (A PRARASHL), 89-91 

hardware resources of the datapath (数据 通路 的 
便 件 资源 )，79 

hardwired control and (人 硬 连 线 控制 )，119-121 

historical perspective and (历史 回顾 )，122-124 

ISA and datapath width ( ISA 和 数据 通路 宽度 )， 
93-94 

key hardware concepts (重要 的 硬件 概念 )，78-91 

microprogrammed control and( 微 程序 控制 )，119 

ROM plus state register and ( ROM 加 状态 寄存 
fit), 96-99 


Processor performance (Ab3# ae TEHE ) 


benchmarks and (基准 测试 程序 )，161-165 
datapath elements for instruction pipeline (指令 
流水 线 的 数据 通路 元 素 )，178-180 
datapath organization leading to lower CPI (改进 
数据 通路 组 织 以 减 小 CPI)，166 
decreasing clock cycle time and (减少 时 钟 周期 
时 间 )，165 
executed instruction reduction and (减少 执行 的 
指令 条 数 )，166 
hazards and ( HK), 185-211 
instruction frequency and (指令 效率 )，160-161 
instruction pipeline problems and (指令 流水 线 问 
mi), 176-178 
instruction-processing assembly line and (i [e] Xb 
理 指令 的 流水 线 )，172--175 
pipeline-conscious architecture and 
implementation (针对 流水 线 的 体系 结构 与 实 
现 )，180-185 
pipelining and (流水 线 )，171-172 


x 71 





simple-minded instruction pipeline and (简单 指 
令 流水 线 )，175-176 

space and time metrics and (时 间 和 空间 性 能 指 
tr), 156-160 

speedup and (加 速 比 )，167-171 

throughput increase and (提升 处 理 器 的 吞吐 
量 )，171 


Processor scheduling (处 理 器 调度 ) 


combining priority and preemption (结合 优先 级 
和 抢占 )，264 

evaluation and (评价 )，265-267 

historical perspective and (历史 回顾 )，273-275 

meta-schedulers (元 调度 项 )，264-265 

nonpreemptive scheduling algorithms ( 非 抢 占 式 
调度 算法 )，247-256 

performance metrics and (人 性 能 度量 )，245-247 

preemptive scheduling algorithms (抢占 式 调 度 
算法 )，256-264 

processor architecture impact and (调度 对 处 理 器 
体系 结构 的 影响 )，267-268 

programs and processes and (程序 和 进程 )，235-349 

scheduling algorithm comparison (调度 算法 的 


比较 )，269 
scheduling environments and (调度 环境 )，239- 
241 


Processors (处 理 器 ) 


block multiplexer channel (阻塞 多 路 复 用 信 
道 )，434 

cache and (缓存 )，345-346，375-377 

demand paging and ( 按 需 分 页 )，317 

input/output and (输入 /输出 )，433-434 

multiplexer channel and (多 路 复 用 信道 )，434 

processor status word (PSW )( 处 理 器 状态 字 ), 
163 

receiving interrupt vector and (接收 中 断 问 量 )， 
146—147 

selector channel and (选择 器 信道 )，434 

sharing and (共享 )，260 

speed and (速度 )，77 

stream-oriented devices ( 面 问 流 的 设备 )，434 


Producer-consumer, classic concurrency 


problem (生产 者 -消费 者 ， 经典 并 发 性 问题 )，592 
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Producer-consumer problem( 生 产 者 -消费 者 问题 )， 
592—593 
Program counter (PC)( 程 序 计数 器 )，37，46，79 
Program counter relative addressing (程序 计数 器 相 
对 寻 址 )，39 
Program discontinuities (程序 不 连续 性 ) 
architectural enhancements and (体系 结构 改进 )， 
135-143 
complete interrupt handler and (完整 的 中 断 处理 
过 程 )，142 
datapath enhancements for interrupts and (针对 中 
斯 处 理 的 数据 通路 改进 )，143-146 
dealing with (XZb##), 132-135 
handling cascaded interrupts (处 理 级 联 中 断 )， 
138-141 
hardware details for handling (处 理 程序 不 连续 
性 的 硬件 细节 )，143-149 
interrupt mechanism at work (工作 中 的 中 断 机 
制 )，150-152 
modifications to FSM and (修改 FSM), 136-137 
modified interrupt handler and (修改 后 的 中 断 处 
理 过 程 )，140 
processor design and (Kb##4hizit), 218-219 
receiving address of handler and (获得 处 理 过 程 
Hott), 146-147 
returning from the handler and (从 处 理 过 程 中 返 
回 )，141--142 
simple interrupt handler and (简单 的 中 断 处 理 过 
fz), 137-138 
stack for saving/restoring and (保存 /恢复 时 的 
He), 147-149 
types of (2844), 130-132 
Program life cycle (程序 生命 周期 )，235-236 
Program memory footprint (内 存 印 迹 )，235 
Program order (程序 顺序 )，214，224，530，560 
Programmable interrupt controller ( PIC) (可 编程 中 
Wiel”), 163 
Programmable logic arrays (PLAs) (可 编程 逻辑 阵 
Al), 120-121 
Programmable read-only memory (PROM) (可 编程 
W Rite), 461 
Programmed data transfer (程序 数据 传输 )，428-429 
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Programmed I/O (PIO)( 程 序 I/O), 427-429 
Programming languages, instruction set design 
and (编程 语言 ， 指 令 集 设计 )，18-19 
Propagation delay (传播 延迟 )，94，689 
Propagation time (传播 时 间 )，640 
Protocol stack (协议 栈 ) 
implementation and (实现 )，697 
Internet protocol stack (因特网 协议 栈 )，628-631 
layer relationships and(〈 各 层 之 间 的 关系 )，683-- 
685 
layering issues and (分 层 的 实际 问题 )，632 
OSI model (OSI 模型)，631--632 
Pseudo-direct addressing, instruction-set design 
and( 伪 直接 寻 址 ， 指 令 集 设计 )，58-59 
Pseudo header, TCP/IP and( 伪 包头 ，TCP/IP)，687 
Punched cards( 打 和 孔 卡片 )，273 
Push/pop, stack operations( 压 栈 / 弹出 ， 栈 操作 )，47 
Push down stack, LRU page replacement and (LRU 
蔡 换 策略 的 下 推 栈 )，330 


Q 
Qualitative metrics, processor scheduling and (定性 
指标 ， 进 程 调度 )，246 

Queuing (排队 ) 

definition of (定义 )，669 
"delays and (延迟 )，625-627，643，665，690 

disk request queue (磁盘 请 求 队列 )，451 
instruction queue (指令 队列 )，224 
packet queues (数据 包 队 列 )，643 
ready queues (HERBAJ), 243-244, 261-262 
timestamping and (Ay/a)#K), 327 


R 
Race conditions, multithreading and (竞争 条 件 ， 
多 线程 )，528-533 
Random access (随机 访问 )，476，670 
Random page replacement (随机 页 替换 )，327 
Read access to cache (对 缓存 的 读 访 问 )，370 
Read after write (RAW) data hazards ( 写 后 读数 据 
冒险 )，187，190-199 
bubbles created by ( 写 后 读 冒 险 产 生 的 气泡 )， 
196, 199 
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data forwarding and (AHHH), 192-197 
load instructions and( 读 取 内 存 的 指令 )，197-199 
shared resources and (分 享 资源 )，220 
Read-modify-write operation ( 读 取 -修改 - 写 人 操 
作 )，582 
Read-only memory (ROM) (只 读 存 储 器 )，97-98， 
116-119 | 
Read stall, pipelining and caches (内 存 延 迟 ， 流 水 
线 和 缓存 )，369 
Read-write conflict, multithreading and (该 写 冲突 ， 
多 线程 )，528-533 
Read/write heads, disk and ( 读 写 磁头， 磁盘)，440 
Readers-writers, classic concurrency problems ( 该 
| RA, ARF REHA), 593-594, 617 
Ready bit, device controller and (就 绪 位 ， 设 备 控 
制 器 )，424 
Ready queue (WRAYI), 243-244, 261-262 
Real-time systems (实时 系统 )，269 
Recording density, disk and (记录 密度 ， WEEE), 440 
Recursion (%19), 54-55 
Reduced instruction set computers ( RISC) (精简 指 
令 集 计算 机 )，66，158 
Reference bit per page frame (每 个 页 帧 引用 位 )， 
332-333 
Reference count fields, i-node and (引用 计数 的 
FX, i-node), 491-493 
Reference counters, approximate LRU and (引用 计 
数 器 ， 近 似 LRU), 332-333 
Register addressing, instruction-set design and ( #7 
存 器 寻 址 ， 指 令 集 设计 )，24 
Register contents, pipelining and (AFANA, Fi 
水 线 )，176 
Register fle〈 寄 存 器 堆 )，79，83 ，194--195 
Register oriented architecture style (面向 寄存 器 的 
体系 结构 )，59 
Register renaming, microarchitecture and ( 47 {F 4 
重 命名 ， 微 体系 结构 )，218 
Register windows (#4 ar fal), 44, 268 
Registers, CPU and (1f #5, CPU), 22-23 
Reliable pipelined protocol (可 靠 的 流水 式 协议 ) 
with ACKs (可靠 的 带 ACK 的 流水 式 传输 )，642 
network congestion and (网 络 拥塞 )，643-644 


sliding window and (滑动 窗口 )，644-647 
Remote procedure call (RPC) (远程 过 程 调 用 )， 
706-707 
Rendezvous, 538-540, 560 
Reorder buffer, microarchitecture and ( Œ HE 22 7, 
AZER), 217-218, 220 
Repeater, networking hardware (2k ¢h, [24 fii 
件 )，679 
Replacement policy, cache (替换 策略 ， 缓 存 )， 
394-396 
Request to send (RTS )( 请 求 发 送 )，674 
Reservation station, microarchitecture and (保留 站 ， 
WAR), 225 
Resource deadlock (资源 死 锁 )，583 
Resource limitations, memory manager and (资源 
RE, AFEA), 279 
Resource utilization, memory manager and (资源 利 
用 ， 内 存 管理 器)，278 
Response time( 啊 应 时 间 )，245，452 
RETI instruction (RETI 指令 )，148-149 
Retransmissions, transport layer ( 重 传 ， 传 输 层 )， 
647-648, 687 
Return address, procedure call and (返回 地 址 ， 过 
程 调 用 )，46 
Return values, procedure call and (返回 值 ， 过 程 
调用 )，47 
Reverse mapping to page tables (页 表 的 反 向 映 
射 )，338 
Ring interconnection network ( 环 状 的 互联 网 
络 )，600 
Ritchie, Dennis, 17, 274 
rmdir, UNIX command (rmdir, UNIX 命令 )，475 
Root directory, file systems and (W H X, XF 
系统 )，507 
Rotational latency, disk and (旋转 延迟 ， 磁 盘 )，444 
Round robin scheduler (轮转 调度 器 ) 
algorithm for (算法 )，263 
details of (细节 ), 262-264 
different system layers and (系统 的 不 同 层 面 )， 
262-263 
processor sharing and (ARIES) =), 260 
putting to work (让 轮转 调度 器 工作 )，260-261 
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time-shared environments and (分 时 环境 )，259 
Round trip time (RTT)( 往 返 时 间 )，636 
Route daemon ( routed), network layer (路 由 守护 
进程 ， 网 络 层 )，668 
Routers, networking hardware (p HH #5. PIi% tE 
fF), 683 
Routing algorithms (路 由 算法 ) 
Dijkstra’s link state routing algorithm ( Dijkstra 
链 路 状态 路 由 算法 )，653-655 
distance vector algorithm (距离 矢量 算法 )，656-657 
hierarchical routing (分 层 路 由 )，657-658 
Routing tables (HZ), 668-669, 683 
Row access strobe (RAS), DRAM and ( 行 访 问 选 
通信 和 号, DRAM), 409-410 


S 
SCAN (elevator algorithm ), disk scheduling and ( 电 
梯 算 法 ， 磁盘 调度 )，453-455 
scanf, C library call (scanf, C 库 调 用 )，235 
Scatter/gather functionality (分 散 /收集 功能 )，634 
Scheduler (Jal ait), 237-238, 241 
Scheduling (调度 ) 
algorithms (算法 )，247 
basics of (基础 )，242-245 
environments and (环境 )，239-241 
multiprocessors and (2 AbFHE), 589-592 
terminologies and (术语 )，245 
Scoreboard, CDC 6600 and (记分 板 ，CDC 6600 ), 249 
Second chance page replacement algorithm (第 二 次 
机 会 页 蔡 换算 法 )，333-336 
Second-level caches (二 级 缓存 )，357 
Sector, disk and (局 区 ， 侯 盘 )，441，443-448， 
450, 466-467, 476-477, 479, 484—485, 
504-505 
Security, processor design and (安全 性 ， 处 理 需 设 
计 )，69 
Seek time, disk and(〈 寻 道 时 间 ， 磁 盘 )，444 
Segmentation (分 段 )，299-301 
address translation with (地 址 转换 )，304 
characteristics and (特性 )，299 
hardware and, 303 
versus paging (434751), 303-308 
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segment table base register (STBR) ( 段 表 基 址 寄存 
fit), 303 

segment tables (Æ), 300 

segmented address (分 段 地 址 )，299 

segmented memory systems (分 段 内 存 系 统 )，307 

segmented virtual memory (分 段 虚拟 内 存 )，297-303 

Selector channel (选择 硕 信 道 )，434 

Semaphore signaling system (信号 量 信号 系统 )，576 

Semiconductor memory (半导体 内 存 )，12 

Sequence number (序列 号 )，634-635，687 

Sequential access, file systems and (顺序 访问 ， 文 
件 系统 )，476 

Sequential consistency (SC) (顺序 一 致 性 )， 
608—610 

Sequential logic, circuits and (时 序 逻 辑 )，78 

Sequential programming model ( 串 行 编程 模型 )，214 

Sequential programs, execution models of ( 串 fF 
编程 ， 执 行 模型 )，533 

Serial advanced technology attachment (SATA) ( 
行 高 级 技术 附件 )，450 

Servers (服务 器 )，226，266，562 

Service model (服务 模型 )，652，669 

Set associative cache (组 相关 缓存 )，387 

Set associativity extremes (组 相关 缓存 的 极端 情 
De), 387-392 

Set up time, register clocking (建立 时 间 ， 寄 存 需 
时 钟 )，94 

SGI Altix, 601, 604 

Shadow register set (T ATAR), 43 

Shared address space multiprocessorrs (共享 地 址 空 
间 多 处 理 器 )，603-606 

Shared resources, managing (共享 资源 ， 管 理 )， 
219-221 

Short-term scheduler (低级 调度 器 )，241 

Shortest job first (SJF), processor scheduling 

and (最 短 作业 优先 ， 处 理 器 调度 )，252-255 
Shortest-path algorithm (最 短路 径 算 法 )，655 
Shortest remaining time first (SRTF ), processor 
scheduling and (最 短 剩 余 时 间 优 先 ， 处 理 硕 调 
度 )，256 

Shortest seek time first (SSTF), disk scheduling and 

(最 短 寻 道 时 间 有 限 ， 磁 盘 调 度 )，453 
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Sign-extend hardware (符号 扩展 硬件 )，108 

Signals, multithreading and (F5, ZAFE), 548 

Simple interrupt handler (简单 中 断 处 理 器 )，137-138 

Simple main memory (简单 的 主 存 )，405 

Simple-minded instruction pipeline (简单 指令 流水 
#), 175-176 

Simulation, scheduler evaluation and (模拟 ， 调 度 
fn Deh), 266-267 

Simultaneous multithreading (同步 多 线程 )，599 

Single bus design ( 单 总 线 设 计 )，86-87 

Single-chip microprocessors ( È% 3t Fr fe Ab FE #8 ), 
123, 614 

Single instruction, loading processor registers and 
( 单 指令 ， 加 载 处 理 器 寄存 器 )，268 

Single instruction multiple data (SIMD) ( 单 指令 多 
数据 )，601-602 

Single instruction single data (SISD) ( 单 指令 单数 
if; ), 600-601 

Sliding window (74a) #10), 644-647 

Small computer systems interface (SCSI) (小 型 计算 
机 系统 接口 )，450 

SMTP (simple mail transfer protocol) (使 用 简单 邮 
件 传输 协议 )，633 

Snoopy caches ( 侦 听 缓存 )，$80-581 

Socket library (Socket JÆ), 634, 695-697 

Soft real-time applications ( 软 实时 应 用 )，270 

Software conventions (软件 管理 )，45 

Software foundation (软件 基金 会 )，274 

Software interrupts〈 软 件 中 断 )，131，502 

Software structuring abstractions (软件 结构 抽象 )， 
561-562 

Solaris threads (Solaris 2&@##), 572-573 

Solid logic technology (SLT) MAZHAR), 122 

Solid state drives (SSD) ( [Al 2 fH 2), 459-461, 
508-509 

Space, microprogrammed control and (空间 ， 微 程 
序 控制 )，119 

Space and time metrics (空间 和 时 间 度 量 )，156-160 

Space overhead (空间 开销 )，367，469 

Space sharing scheduler (43H) H FAES), 590-591 

Spatial locality (空间 局 部 性 )，355，377-384 

Speedup, processor (JME, AbF#RE), 167-171 


Split transaction buses (分 离 传输 总 线 )，433 

Stack for saving/restoring (保存 /恢复 时 的 栈 )， 
147-149 

Stack oriented architecture style (面向 栈 的 体系 结 
构 )，59 

Stack pointer ( 栈 指针 )，44，55，147-148 

Stack switching ( 栈 切 换 )，147-148 

Stalled pipeline (被 拖延 的 指令 )，187，210 

Standard Performance Evaluation Corporation 
(SPEC), 163 

Starvation (WLR), 247, 585-586 

State of the caller, procedure call and (调用 者 状态 ， 
过 程 调用 )，43-45 

State register, control unit and (状态 寄存 器 ， 控 制 
单元 )，96-99 

Static address translation (静态 地 址 转换 )，310 

Static instruction frequency (指令 频率 )，160-161， 
170 

Static properties, processor scheduling and (静态 特 
性 ， 处 理 侣 调度 )，238 

Static random access memory (SRAM)( 静 态 随 机 访 
问 存储 )，354 

Static relocation, memory management and (静态 
重 定 位 ， 内 存 管理 )，282-284 

Status register, device controller and (RAAR, 
ik a4 till ae), 424 

Stop-and-wait protocols (停止 并 等 待 协议 )，637- 
639 

Storage (存储 ) . See Disk storage (参见 磁盘 存储 ) 

Store and forward (存储 与 转发 )，664，669 

Stored program computer (存储 程序 计算 机 )，15，122 

Stream-oriented devices (面向 流 的 设备 )，434 

Streaming data ( 流 数 据 )，67 

Streaming devices ( 流 式 设 备 )，429 

Structural pipeline hazards (结构 性 流水 线 冒 险 )， 
175, 186-188 

Structured data types (结构 化 数据 类 型 )，35 

Subsystem interactions, filing systems and ( 子 系统 
交互 ， 文 件 系统 )，500-503 

Successful lookup, caches and (成 功 查找 ， 绥 存 )， 
356 

Sun SPARC, 31, 44 ` 
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Super input/output (Super I/O )( 超 级 1/0), 465 
Superblock, file systems and (超级 块 ， 文 件 系统 )， 
506 
Superscalar processors (超标 量 处 理 咒 )，123 
Swapping out, memory management and (替换 走 ， 
内 存 管理 )，283 
Switch/router, networking hardware (交换 机 / 路 由 
fir, PZ HE), 669 
Switch statement (switch ^J), 40-41 
Switched Ethernet, 673, 679 
Switches, networking hardware (交换 机 ， 网 络 硬 
件 )，679-681 
Symmetric multiprocessor (SMP) (对 称 多 处 理 机 )， 
578-579 
Synchronization (同步 ) 
among threads (线程 间 同 步 )，533-540 
synchronization race (同步 竞争 )，5$28 
synchronous events (同步 事件 )，130 
synchronous logic circuits (同步 逻辑 电路 )，91 
synchronous transfer unit (同步 传输 单元 )，429-430 
synchronously produced data (同步 产生 数据 )， 
428-429 
System/360 series, IBM (System/360 %7], IBM), 
309-310 
System/370 series, IBM (System/370 #¥!), IBM), 
310 
System bus (系统 总 线 )，11，432-433 
System calls (系统 调用 )，131，158 
System centric metrics (系统 中 心 的 度量 )，245 
System crashes (系统 朋 演 )，508 
System stack (系统 栈 )，147 
Systolic architectures (收缩 体系 结构 )，122-123 


T 
Tag field, caches and (Rit Ft, RAF), 363-364 
Taking turns (轮流 访问 )，670 

Tanenbaum, Andrew, 17, 274 

Tasks (任务)，238-239 

TCP/IP header (TCP/IP 包头 )，687 

Teardown, connection (hi, HEHE), 629 
Telecommunications (ifm), 710-711 

Temporal locality (空间 局 部 性 )，355 


Test-and-set instruction (Test-and-Set 指令 )，575-578 
Thicknet ( 粗 缆 网 络 )，712 
Thinnet( 细 缆 网 络 )，712-714 
Third-level cache (3 级 缓存 )，357 
Third party vendors (第 三 方 供应 商 )，461-462 
Thompson, Ken, 17, 274 
Thrashing (if), 241, 243, 338-342 
Threads ( 线 ##), 238-239. See Multithreading (4 
见 多 线程 ) 
creation and termination (创建 和 终止 )，523- 
525, 574-575 
thread communication (线程 通信 )，574-575 
thread control blocks (线程 控制 块 )，567-568 
thread level parallelism (线程 级 并 行 )，596-599 
thread of control (控制 线程 )，524 
thread-safe wrappers( 库 调用 线程 安全 的 封装 )，574 
Threads library (线程 库 ) 
kernel-level threads (内 核 级 线程 )，570-573 
safety and (安全 性 )，573-574 
Solaris threads and (Solaris 线程 )，572-573 
user level threads and (用 户 级 线程 )，567-570，573 
Three-operand instructions (三 操作 数 指令 )，22，60 
Throughput (#Flt#t), 171, 245, 452 
Time-division multiplexing (TDM)( 时 分 多 路 复 用 )， 
663, 669 
Time of flight (传播 时 间 )，689 
Time quantum (时 间 段 )，416 
Time-shared operating systems (分 时 操作 系统 )，710 
Time-sharing environments (分 时 环境 )，240 
Timeline of scheduling processes (调度 进程 的 时 间 
轴 )，246 
Timer device (ENT HR), 268 
Timer interrupt handler (时 间 中 断 处 理 器 )，263 
Timesharing (分 时 )，13，274 
Timeslice (时 间 片 )，259 
Token ring ( 令 牌 环 )，675-677 
Tomasulo, Robert, 219 
Tomasulo algorithm (Tomasulo 算法 )，219-220 
Top-half handlers (top-half 处 理 过 程 )，Linux，154 
Top-level procedure, threads and (顶层 过 程 ， 线 程 )， 
560 
Torvalds, Linus, 17, 274 
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Total execution time (总 执行 时 间 )，162 
Tracker threads, data structure and (跟踪 部 件 线程 ， 
数据 结构 )，527 
Tracks, disk storage and (fi, ERITI), 440- 
441 
Translation lookaside buffer (TLB )( S486 4444224 ), 
296, 343-346, 386-387, 399-400 
Transmission control protocol (TCP) (传输 控制 协 
W), 629, 648-649 
Transmission delay (fi ZEIE ), 94, 689 
Transmission errors (传输 错误 )，647-648 
Transport layer (传输 层 ) 
expected functionality of (预期 功能 )，634-646 
Internet protocols and (因特网 协议 )，629，648- 
651 
pipelined protocols and (流水 式 协 议 )，640-642 
reliable pipelined protocol (可 靠 的 流水 式 协 议 )， 
642—647 
stop-and-wait protocols and (停止 并 等 竺 协议 )， 
636-639 
transmission errors and (传输 错误 )，647-648 
Traps (BA), 131-132, 135, 282, 317. See also 
Program discontinuities (程序 不 连续 性 ) 
Tree interconnection network ( 树 状 的 互联 网 )，600 
Tree structure, file systems ( 树 结 构 ， 文 件 系 
统 )，471 
Tristate buffers (= 2522445), 87 
Truth table (HAF), 119 
Turing, Alan, 15-16 
Turing Award (Al 2242), 712 
Turing machine (AI HL), 15-16 
Turnaround time (周转 时 间 )，452 
Two bus design( 双 总 线 设 计 )，87-89 
Two-level page table (二 级 页 表 )，347 
Two-operand instructions ( 双 操 作 数 指令 )，60 


U 
Unconditional jump instruction (无 条 件 跳 转 指 令 )， 
39—40 
Unit of execution, threads and (执行 单元 ， 线 程 )，524 
Unit of memory access and transfer (内 存 访问 和 转 
换 单元 )，377 


Univac, 470 
Universal serial bus (USB) (通用 串 行 总 线 )，462 
UNIX 
file system commands (文件 系统 命令 )，475 
history of (JH), 274 
hybrid allocation approach and (混合 分 配方 式 )， 
491 
i-node data structure and (索引 节点 数据 结构 )， 
497 一 498 
i-node tables and (索引 节点 表 )，516 
network file system (网 络 文件 系统 )，706-707 
operating system (操作 系统 )，17 
programming and (编程 )，699-706 
remote procedure call in (远程 过 程 调用 )，706- 
707 
UNIX sockets (UNIX 套 接 字 ) 
client-server relationship and (% F vig — IR 4 4 
MIKA), 702-703 
client side socket call (客户 端 套 接 字 调用 )，702 
creation of (创建 )，699-700 
datagram socket communication (数据 报 套 接 字 
通信 )，705 
establishing server communication and (建立 服 
务 器 通信 )，701-703 
interprocess communication and (进程 间 通 信 )， 
700-701 
server side socket call (fle 4 ai Ym & fe Val FA ), 
700 
server socket after bind call (已 经 绑 定 的 服务 器 
套 接 字 )，701 
server socket after listen and accept calls (监听 并 
接受 呼叫 的 服务 器 套 接 字 )，701 
socket library and〈 套 接 字 库 )，706 
stream socket data communication (数据 流 类 型 
的 套 接 字 )，704 
Upcalls (上 行 调用 )，263，502-503，570 
User centric metrics (用 户 中 心 的 指标 )，245 
User datagram protocol (UDP) (用 户 数 据 报 协议 )， 
629, 634, 648—650 
User/kernel mode (用 户 / 内 核 模式 )，268 
User level threads (用 户 级 线程 )，567-570，573 
User mode (用 户 模式 )，148，149 
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User stacks (HFFR), 147, 149 
V 
Vacuum tubes (454%), 12, 12f 
Variable-size partitions (可 变 长 分 区 ), 287-289 
Variance in response time( 啊 应 时 间 的 变化 )，246 
Variance in wait time (等 竺 时 间 的 变化 )，452 
VAX 11 architecture (VAX 11 体系 结构 )，59 
Vector supercomputers( 问 量 超 级 计算 机 )，226 
interrupt (HEK, PW), 147 
Vectors (Jit), 35, 134 
Vertical microcode (Œ Fi"), 119 
Very large scale integration ( VLSI) (超大 规模 集成 
电路 )，12 
Victim page, picking (被 蔡 换 页 ， 挑 选 )，320 
Victim selection, page replacement and (被 蔡 换 页 
jee, TTR), 326 

Video games (视频 游戏 ) 

application hardware-operating system 

操作 系统 ) 

interactions (42.4), 5-8, 7f 

音频 / 视频 的 内 容 )，4 


Vector tables, 


(应 用 硬件 


audio/visual content and (74 
networked (KM), 5, 6f 
operating system role in (操作 系统 的 作用 )，5-8 
software architecture for (软件 架构 )，3，3f 
Video processing pipeline (视频 处 理 流水 线 )，523 
Virtual address (VA)( 虚 拟 地 址 )，291，399，402 
Virtual circuit (VC)( 虚 电路 )，667，669 
Virtual file system (VFS)( 虚 拟 文件 系统 )，509 
Virtual local area networks (VLAN), 
networking hardware (网 络 便 件 )，682 
Virtual memory (虚拟 内 存 ) 
paged (分 页 虚拟 内 存 )，290-297 
relative sizes of (相对 大 小 )，296-297 
segmented (分 段 )，297-303 
size and latency and (相对 容量 和 延 返 )，416 
Virtual page number (VPN) (虚拟 页 编写)，291， 
295-296, 399, 402-403 
Virtual-to-physical address translation (虚拟 地 址 到 
物理 地 址 的 转换 )，400 
Virtualization, processor design and (虚拟 化 ， 处 
理 需 设计 )，69 


Virtually indexed physically tagged cache (虚拟 索引 
物理 标记 的 缓存 )，401-402 

Virtually tagged caches (虚拟 标记 缓存 )，403 

VLIW (very long instruction word ) processors ( 超 
长 指令 字体 系 结构 处 理 器 )，123-124 

von Neumann, John, 15 

von Neumann architecture (15 + 诺 依 曼 体系 结构 )，122 


W 
Wear leveling (损耗 均衡 )，461，509 
Weighted arithmetic mean (WAM) (加 权 算 术 平 均 
数 )，162，170 
Windows 95, 275 
Windows 2000, 275 
Windows CE, 13 
Windows NT, 275 
Windows NT 4.0, 275 
Windows Version 35, 7, 
Windows Vista, 275 
Windows XP, 275 
Wire delay (245638 ), 94, 611 
Wireless LAN (702% LAN), 674-675 
Word operands (#2/F20), 32-34 
Word precision (FA) ), 28 
Working set ( TÆ), 340-341, 383 
Workload (工作 人 负载)，266 
World Wide Web (WWW) (万 维 网 )，633. See also 
Internet (参见 因特网 ) 
Worst case delay for signal propagation (最 坏 情 况 
下 信和 号 传播 延迟 )，85 
Write access to cache from CPU ( CPU 对 缓存 的 读 
访问 )，370-375 
no-write allocate ( 非 写 分 配 )，373 
write allocate (44 ft), 372-373 
write-back policy ( 回 写 策略 )，373-374 
write-through policy (连续 写 策 略 )，370-372 
Write after read (WAR) data hazard ( 读 后 写 数据 冒 
), 189-190, 199-200, 220 
Write after write ( WAW) data hazard (‘5 Ja 5 SG 
EK), 189-190, 199-200, 220-221 
Write allocate, write-miss handling ( 写 分 配 ， 写 缺 
失 处 理 )，372--373 


Li, 275 


530 


Write-back policy ( 回 写 策略 )，373-374 

Write buffer ( 写 缓冲 区 )，371，393 

Write merging ( 写 合并 )，374 

Write stall, pipelining and caches ( 写 拖延 ， 流 水 线 
和 缓存 )，369，371 

Write-through policy (连续 写 策略 )，370-372 

Write-update protocol ( 写 人 更 新 协议 )，580 


X 
Xbox, 269 
Xeon, Intel, 76, 121, 222, 610 
Xerox, 713 


Xerox PARC, 713 


x 4 


XScale processors (XScale 处 理 硕 )，123 


¥ 
Yahoo!, 8, 633 


Pa 
Z bit, control unit (Z 位 ， 挖 制 单元 )，116 
Z register, control unit (Z 寄 存 器 ， 控 制 单元 )， 
92-93 
Zero-operand instructions (4#2/F R454 ), 59-60 
Zoned bit recording ( ZBR), magnetic disk and (Xj 
MERK, WEEK), 441-444 


